بهعنوان یک متخصص داده، احتمالاً با طرحوارهها یا انواع مدل داده در هوش تجاری آشنایی دارید. برای افرادی که آشنایی کمتری با این حوزه دارند، باید بگوییم که بهعنوان یک متخصص داده ضروری است که درباره اصطلاحات اساسی این حوزه آشنایی پیدا کنید. در این مقاله میخواهیم شما را انواع مدل داده در هوش تجاری آشنا کرده و به بررسی مشخصات هر یک بپردازیم.
اسکیما یا انواع مدل داده در هوش تجاری چیست؟
اسکیما یا انواع مدل داده در هوش تجاری را بهعنوان ساختارهای منطقی میشناسند که نحوه سازماندهی، ذخیره و دسترسی به انواع مختلف داده در انبار داده یا بازار داده را تعریف میکنند. طرحوارهها در بهبود عملکرد و قابلیت استفاده و دقت تجزیهوتحلیل دادهها و گزارشدهیها میتوانند کمککننده باشند. در ادامه درباره این طرحوارهها یا همان انواع مدل داده در هوش تجاری صحبت خواهیم کرد.
طرحواره یا همان اسکیما چه کاربردی را در علم داده و هوش تجاری دارد؟
طرحواره بهعنوان یکی از انواع مدل داده در هوش تجاری یک مفهوم اساسی در طراحی پایگاهداده است که دادهها را در یک ساختار منطقی سازماندهی میکند. طرحواره نقش مهمی را در توانمندسازی سازمانها برای استخراج بینشی معنیدار از دادههای سازمان ایفا میکند.
انواع مدل داده در هوش تجاری بهعنوان طرحهایی شناخته میشوند که ساختار و روابط عناصر داده را در انبار داده یا بازار داده یک سازمان تعریف میکنند. این ابزار بهنوعی درک مشترک از دادهها را فراهم میکند و دسترسی، تجزیهوتحلیل و گزارش آن را آسانتر میکند.
مزایای استفاده از انواع مدل داده در هوش تجاری بسیار زیاد هستند. اولاً، با تعریف فرمتهای استاندارد برای داده، سازگاری و دقت دادهها را تضمین میکند. ثانیاً، با بهینهسازی ذخیرهسازی دادهها و استراتژیهای نمایهسازی، تجزیهوتحلیل سریعتر را امکانپذیر میکند. ثالثاً، استفاده از انواع مدل داده در هوش تجاری با ارائه یک چارچوب استاندارد، ادغام منابع داده جدید و تبدیل دادهها را آسانتر میکند.
درصورتیکه یکی از انواع مدل داده در هوش تجاری بهخوبی طراحی شده باشد، با ارائه دیدی جامع از دادههای سازمان، منجر به تصمیمگیری بهتر در سازمان میشود. این قابلیت به کاربران اجازه میدهد تا بهراحتی دادهها را از طریق داشبوردها و گزارشهای بصری جستجو و کاوش کنند.
آشنایی با انواع مدل داده در هوش تجاری
در این بخش شما را با انواع مدل داده در هوش تجاری آشنا میکنیم. طرحواره یا انواع اسکیما در هوش تجاری شامل موارد مختلفی هستند. سه مورد از مهمترین و پرکاربردترین مدلهای داده در هوش تجاری، مدل ستاره، کهکشانی و دانه برفی است. هر کدام از اینها مشخصاتی دارند و بر مبنای این مشخصات مزایا و معایبی را برای پایگاه دادهای که از آنها استفاده میکند، خواهند داشت. در اینجا شما را با تعاریف و کاربردهای هر یک از این مدلهای داده آشنا میکنیم.
مدل ستاره
مدل ستاره بهعنوان یکی از سادهترین و پرکاربردترین انواع مدل داده در هوش تجاری در یک انبار داده محسوب میشود. علت نامگذاری این طرحواره به این نام این است که از یک جدول واقعیت (فکت) در مرکز و چندین جدول ابعادی در اطراف تشکیل شده که شکلی شبیه یک ستاره را ایجاد میکنند. جدول واقعیت که در مرکز قرار دارد، روابط چندبعدی خود را با تمام جداول ابعادی حفظ میکند. ارتباط این جداول نیز بدین صورت است که هر سطر از جدول واقعیت با یکی از سطرهای اول جداول ابعاد مرتبط خواهد بود.
در ضمن ارتباط بین این جداول با یک کلید یا رمز مرجع خارجی صورت میپذیرد. بدین ترتیب پیمایش در میان جداول در این مدل برای جستجوی دادههای تجمیع شده بسیار آسانتر خواهد شد.
نحوه طراحی مدل ستاره:
طراحی مدل ستاره، بهعنوان یکی از انواع مدل داده در هوش تجاری کار سختی نیست. اگر با مفاهیم طراحی این طرحواره آشنایی داشته باشید، درک نحوه ساخت آن بسیار ساده و آسان خواهد بود. در ادامه با فرایند ایجاد یک طرحواره ستاره آشنا میشوید.
در مرحله اول شما باید فرایند کسبوکار خود را برای تجزیهوتحلیل داده ها شناسایی کرده و تعیین کنید که با چه هدفی میخواهید این فرایند را پیش ببرید. به طور مثال اگر فرایند تجاری شما شامل فروش اجناس مختلفی است، شما باید در مرحله دوم به شناسایی جدول واقعیت و اقدامات لازم برای هر یک بپردازید. در مرحله سوم نوبت به شناسایی ابعاد مختلف اجزای جدول واقعیت میرسد؛ از جمله آنها میتوان به بعد زمانی، بعد مکانی، بعد محصول و حتی بعد سازمانی اشاره کرد. این موارد در ادامه بهعنوان سردسته هر کدام از جداول ابعاد به شمار خواهند رفت.
در مرحله چهارم، شما باید هر کدام از ستونهای جدول ابعاد را توصیف کنید. به طور مثال، در بعد منطقه باید مناطقی را که قصد فروش کالای خود را دارید، مشخص کنید. در بعد زمان باید زمانهایی را که تیم فروش شما فعالیت خواهند کرد، مشخص کنید. در مرحله پنجم پایینترین سطح جدول واقعیت که شامل درآمد حاصل از فروش میشود، تکمیل خواهد شد. بدین صورت شما یک طرحواره یا مدل ستاره را بهعنوان یکی از انواع مدل داده در هوش تجاری طراحی کردهاید.
مزایا:
درباره مزایای مدل ستاره بهعنوان یکی از سادهترین انواع مدل داده در هوش تجاری میتوانیم به موارد مختلفی اشاره کنیم.
- مدلسازی ساده دادهها: مدل ستاره، بهعنوان یکی از انواع مدل داده در هوش تجاری از یک طراحی ساده و شهودی پیروی میکند که درک و پیادهسازی آن آسان است. این ساختار مدلسازی فرایندها و روابط پیچیده تجاری را آسان میکند.
- بهبود عملکرد کوئریها: طراحی ساده شده مدل ستاره تضمین میکند که دادهها بهگونهای ذخیره میشوند که عملکرد کوئریها را بهینه میکند. کوئری (Query) در علم داده به درخواستی اطلاق میشود که برای استخراج اطلاعات از پایگاهداده به کار میرود.
- قابلیت دسترسی پیشرفته به دادهها: رویکرد غیر نرمال طرحواره ستارهای روشی بصریتر و کاربرپسندتر برای دسترسی به دادهها را فراهم میکند.
- یکپارچهسازی بهتر دادهها: طراحی استاندارد مدل ستاره، بهعنوان یکی از انواع مدل داده در هوش تجاری، ادغام منابع داده جدید را در انبار داده یا بازار داده آسانتر میکند.
- بهبود کیفیت داده: طرح ساده مدل ستاره با بهحداقلرساندن تناقضات دادهها، سازگاری و کاملبودن دادهها را تضمین میکند.
مدل دانه برفی
مدل دانههای برف نوعی دیگر از انواع مدل داده در هوش تجاری است که برای نمایش دادهها به روشی ساختاریافته استفاده میشود. بر خلاف طرحواره ستاره که طراحی سادهتر و شهودیتری دارد، مدل دانههای برف ساختار پیچیدهتر و نرمالتری دارد که میتواند نیازهای تجاری پیچیدهتری را برآورده کند.
در یک مدل دانههای برفی، جداول ابعاد با چندین جدول مرتبط، یک ساختار سلسلهمراتبی ایجاد میکنند. مدل دانههای برف نوعی از مدل ستارهای است که جداول ابعاد غیر نرمالشده را نشان میدهد که مستقیماً به جدول واقعیت متصل هستند.
نحوه طراحی مدل دانه برف
برای طراحی مدل دانه برف مراحل زیر را میتوان دنبال کرد:
- ابتدا جدول واقعیت و معیارهایی که در آن قرار میگیرد را شناسایی کنید. جدول واقعیت باید حاوی کلیدهایی باشد که به جداول ابعاد مرتبط هستند.
- جداول ابعاد و ویژگیهایی را که حقایق را توصیف میکنند، شناسایی کنید.
- جداول ابعاد را با حذف ویژگیهای اضافی و تشکیل جداول جداگانه سادهتر کنید. بهعنوانمثال، اگر یک جدول ابعاد حاوی ویژگیهای کشور، ایالت، شهر و کد پستی باشد، میتوان آنها را به دو جدول تقسیم کرد: یکی برای کشور و استان و دیگری برای شهر و کد پستی.
- جداول ابعاد را با استفاده از کلیدهای خارجی که با کلیدهای جدول واقعیت مطابقت دارند، به جدول واقعیت متصل کنید. طرح بهدستآمده باید شبیه یکشکل دانه برف باشد؛ با جدول واقعیت در مرکز و جداول ابعاد منشعب در سطوح مختلف.
مزایای مدل دانه برف
مزایای مدل دانه برف عبارتاند از:
- با نرمال (ساده) سازی جداول ابعاد، افزونگی دادهها و فضای ذخیرهسازی را کاهش میدهد.
- تجزیهوتحلیل دادهها را با ارائه اطلاعات دقیقتر و جزئیتر تسهیل میکند.
- کیفیت و سازگاری دادهها را با اجتناب از ناهنجاری دادهها بهبود میبخشد.
- با کاهش تعداد اتصالات، عملکرد کوئری را افزایش میدهد.
مدل کهکشان
مدل کهکشانی نوعی دیگر از انواع مدل داده در هوش تجاری است که برای نمایش دادهها به روشی چندبعدی استفاده میشود. این مدل پیچیدهتر و انعطافپذیرتر از مدل دانههای برف است که امکان ایجاد جداول چندگانه واقعیت و جداول ابعاد را فراهم میکند که از طریق یک جدول مرکزی به هم مرتبط شدهاند. هر جدول واقعیت یک فرایند تجاری یا معامله خاص را نشان میدهد و هر جدول غیر نرمال اطلاعات متنی در مورد معیارهای موجود در جدول واقعی مربوطه را ارائه میدهد. جدول هاب یا مرکزی همه جداول واقعیت و جداول ابعاد را به هم پیوند میدهد و یک نقطه مرجع مرکزی برای همه دادههای موجود در انبار داده ارائه میدهد.
نحوه طراحی یک مدل کهکشانی
برای طراحی یک مدل کهکشانی میتوان مراحل زیر را دنبال کرد:
در ابتدا جداول واقعیت و معیارهایی که در آنها ذخیره میشوند را شناسایی کنید. جداول حقایق باید حاوی کلیدهایی باشد که به جداول ابعاد مرتبط هستند. هر جدول واقعیت باید یک فرایند تجاری یا حوزه موضوعی متفاوت، مانند فروش، موجودی یا خدمات مشتری را نشان دهد.
در گام بعدی جداول ابعاد و ویژگیهایی را که توصیف میکنند را شناسایی کنید. جداول ابعاد باید حاوی دادههای توصیفی یا دستهبندی باشد. برخی از جداول ابعاد ممکن است توسط چندین جداول واقعیت به اشتراک گذاشته شوند، درحالیکه برخی دیگر ممکن است مختص یک جدول واقعی باشند.
جداول ابعاد را باتوجهبه نیازهای آنالیز داده، به روشی که در نحوه طراحی مدل دانه برف توضیح داده شد، نرمال یا غیرنرمال کنید.
جداول ابعاد را با استفاده از کلیدهای خارجی که با کلیدهای جداول واقعیت مطابقت دارند، به جداول واقعیت متصل کنید. طرح بهدستآمده باید شبیه یکشکل کهکشان باشد؛ جداول واقعیت در مرکز و جداول غیر نرمال در چندین سطح منشعب میشوند.
مزایای مدل کهکشانی
مزایای مدل کهکشانی عبارتاند از:
- مدل کهکشانی طرحوارهای انعطافپذیر را ارائه میدهد که میتواند چندین فرایند تجاری را در خود جای دهد.
- مدل کهکشانی امکان تجزیهوتحلیل پیچیده و جامع را در جداول واقعی مختلف و ابعاد مشترک فراهم میکند.
- مدل کهکشانی با استفاده مجدد از جداول ابعاد، افزونگی دادهها و فضای ذخیرهسازی را کاهش میدهد.
- کیفیت و سازگاری دادهها را با حفظ مقادیر و تعاریف یکسان برای ابعاد مشترک بهبود میبخشد.
مقایسه انواع مدل داده در هوش تجاری
تا به اینجای مقاله به بررسی انواع مدل داده در هوش تجاری پرداختیم. برای سادهتر کردن، میخواهیم به مقایسه هر سه مدل داده در یک جدول کامل بپردازیم.
ساختار | جدول ابعاد | فضای ذخیره سازی | عملکرد کوئری | پیچیدگی کوئری | افزونگی داده مورد استفاده | موارد کاربرد |
ستاره
| یک جدول در هر بعد. | از فضای ذخیره سازی بیشتری استفاده می کند. | سریع، اتصالات کمتر مورد نیاز است. | ساده و آسان برای درک. | زیاد. | جداول ابعاد با چند ردیف. |
دانه برف | جداول متعدد برای هر بعد. | از فضای ذخیره سازی کمتری استفاده می کند. | آهسته، اتصالات بیشتری مورد نیاز است | پیچیده و درک آن سخت است. | کم. | جداول ابعاد با سطرهای زیاد، با انبارهای داده. |
کهکشان | برخی از جداول با چند بعد مشترک هستند. | بستگی به سطح نرمال شدن دارد. | بستگی به تعداد جداول واقعیت و ابعاد دارد. | پیچیده و درک آن سخت است. | بستگی به سطح نرمال سازی دارد. | جداول چندگانه واقعیت که نشان دهنده فرآیندهای تجاری یا حوزه های مختلف است. |
سخن پایانی
در این مقاله، شما را با انواع مدل داده در هوش تجاری آشنا کردیم. در پایان، درصورتیکه به کسب اطلاعات بیشتر در حوزه هوش تجاری تمایل دارید، مطالعه ادامه مقالات آموزشی وبلاگ گنج دیجیتال را از دست ندهید.