آشنایی با هوش تجاری
هوش تجاری را که با نام Business intelligence میشناسیم، بهعنوان ابزاری شناخته میشود که در راستای تجزیهوتحلیل دادههای سازمانهای تجاری مورد استفاده قرار میگیرد. این ابزار امکان مرتبسازی خیل کثیری از دادههای موجود در هر سازمان را بهگونهای که امکان استنباط نکاتی مفید برای فعالیتهای تجاری سازمان وجود داشته باشد، فراهم میسازد. برای کار با ابزارهای هوش تجاری، شما باید با لایههای اصلی این سیستم آشنایی پیدا کرده و با جزئیات هر یک آشنا شوید. در این مقاله قصد داریم تا لایه های اصلی BI را شرح داده و به بررسی تمام جزئیات موجود درباره آنها بپردازیم.
آشنایی با لایه های اصلی BI
ازآنجاییکه هوش تجاری از چندین لایه تشکیل شده است، استفادهکنندگان از ابزارهای BI باید با لایه های اصلی BI آشنایی داشته باشند. در ادامه شما را با لایههای اصلی هوش تجاری آشنا میکنیم.
منبع داده، یکی از لایه های اصلی BI
منبع داده را میتوان یکی از لایه های اصلی BI دانست که بهعنوان مرجعی برای عملکرد هوش تجاری شناخته میشود. بدین صورت که تمامی دادهها برای تجزیهوتحلیل توسط BI باید از این منابع استخراج شوند. چنین منابعی ممکن است از داخل یا خارج سازمان باشند. ممکن است که این منبع شامل پایگاههای داده، انبارهای داده، صفحات گسترده و یا فایلهای اکسل و هرگونه منبع داده ساختاریافته یا بدون ساختار باشند.
لایه منبع داده بهعنوان یکی از مهمترین لایه های اصلی BI شناخته میشود که دادههای خام برای آغاز تجزیهوتحلیل به کمک هوش تجاری را فراهم میکند. بدون این لایه هیچگونه دادهای برای تجزیهوتحلیل وجود نداشته و امکان هیچگونه گزارشدهی وجود نخواهد داشت. در ضمن لایه منبع داده تضمین میکند که دادهها همواره دقیق و بهروز باشند که این کار از طریق اجرای تکنیک پاکسازی دادهها به کمک استانداردسازی دادهها و ابزارهای پاکسازی داده میسر میشود.
با داشتن یکلایه منبع داده متمرکز، سیستمهای BI میتوانند دادهها را از چندین منبع در یک مخزن واحد برای تجزیهوتحلیل ادغام کنند. این کار به ارائه دید جامع از عملکرد سازمان کمک میکند و تجزیهوتحلیل داده ها را تسهیل میکند. همچنین سازمانها را قادر میسازد تا گزارشهای خود را ادغام کنند و نیاز به گزارشدهی اضافی را حذف کنند.
استخراج، پالایش، بارگذاری داده (ETL)
استخراج، پالایش، بارگذاری اطلاعات (ETL) یکی دیگر از لایه های اصلی BI است که بهعنوان جزئی حیاتی در هر سیستم هوش تجاری (BI) شناخته میشود. ETL فرایند استخراج دادهها از منابع مختلف، تبدیل آن به قالبی مناسب برای تجزیهوتحلیل و بارگذاری آن در انبار داده یا بازار داده است. این فرایند شامل چندین بخش فرعی از جمله استخراج داده، پالایش و بارگذاری داده است.
استخراج دادهها. استخراج دادهها اولین مرحله از فرایند ETL بهعنوان یکی از لایه های اصلی BI است. در این مرحله دادهها از منابع مختلف مانند پایگاههای داده عملیاتی، فایلهای اکسل و سایر منابع داده استخراج میشوند. فرایند استخراج دادهها را میتوان با استفاده از ابزارهایی مانند SQL Server Integration Services (SSIS)، Informatica یا Talend بهصورت خودکار انجام داد. این ابزارها را میتوان برای استخراج دادهها بر اساس برنامههای از پیش تعریف شده پیکربندی کرد.
تبدیل داده. مرحله بعدی با تبدیل داده دنبال میشود. این مرحله از لایه های اصلی BI فرایندی است که در آن تمام دادههای جمعآوریشده قبل از ذخیرهسازی در انبار داده به طور مناسب قالببندی میشوند. مجموعه خاصی از قوانین یا کدها معمولاً برای تبدیل دادهها به یک قالب قابل خواندن دنبال میشوند.
بارگذاری داده. آخرین مرحله ETL بهعنوان یکی از لایه های اصلی BI، جایی است که شما با موفقیت دادهها را در مقصد جدید آن یعنی انبار داده (Warehouse) بارگیری میکنید. این مرحله یک فرایند بسیار مهم است که نیاز بهدقت زیادی دارد. دادههایی که باید آپلود شوند معمولاً بسیار زیاد هستند و بسته به نوع داده باید یک استراتژی از پیش برنامهریزیشده داشته باشید.
انبار داده و تجمیع اطلاعات (Data Warehouse)
انبار داده (Data Warehouse) یکی دیگر از لایه های اصلی BI است که بهعنوان یک مخزن متمرکز برای دادههای مختلف یک سازمان طبقهبندی میشود. این لایه از لایه های اصلی BI برای پشتیبانی از فرایندهای تصمیمگیری با ارائه یک منبع واحد از دادههای دقیق و بهروز برای تجزیهوتحلیل طراحی شده است. در زمینه هوش تجاری (BI)، انبار داده یکی از اجزای حیاتی هر سیستم BI است؛ زیرا پایه و اساس تجزیهوتحلیل، گزارش و تجسم دادهها را فراهم میکند. انبار داده برای ذخیره حجم زیادی از دادههای ساختاریافته و نیمهساختاریافته از منابع مختلف طراحی شده است. دادههای تبدیل شده به یک طرح مدلسازی داده ستاره یا طرح مدلسازی داده دانه برفی سازماندهی میشوند.
طرح مدلسازی داده ستاره: یک مدل ساده شده است که از جداول واقعیت و جداول ابعاد تشکیل شده است. جداول واقعیت حاوی معیارهای عددی مانند فروش، درآمد و سود هستند؛ درحالیکه جداول ابعاد حاوی ویژگیهای توصیفی مانند محصول، مشتری، زمان و مکان هستند.
طرح مدلسازی داده دانه برفی: یک مدل داده پیچیدهتر است که از جداول واقعیت، جداول ابعاد و جداول زیر بعدی تشکیل شده است. جداول زیر بعدی حاوی ویژگیهای دقیقتری نسبت به جداول ابعاد هستند که کاربران را قادر میسازد تا تجزیهوتحلیل بیشتری را انجام دهند.
انبار داده همچنین از تجزیهوتحلیل چند بعدی پشتیبانی میکند و کاربران را قادر میسازد تا تجزیهوتحلیل را در چندین بعد به طور همزمان انجام دهند. این ویژگی کاربران را قادر میسازد تا روندها، الگوها و ناهنجاریهایی را در دادهها شناسایی کنند که ممکن است هنگام تجزیهوتحلیل تکبعدی یا به طور جداگانه مشخص نباشند.
مدل سازی داده ها و پیاده سازی تحلیل ها (OLAP Data Modeling)
OLAP (پردازش تحلیلی آنلاین) قابلیتی است که کاربران را قادر میسازد تا محاسبات پیچیده را بر روی حجم زیادی از دادهها به طور همزمان انجام دهند. OLAP جزء حیاتی هر سیستم هوش تجاری (BI) است؛ زیرا تجزیهوتحلیل دادهها را تسهیل میکند. مدلسازی دادههای OLAP شامل مراحل مختلفی مانند شناسایی نیازمندیهای کسبوکار، تعریف ابعاد دادهها، طراحی جداول واقعیت و پیادهسازی سلسلهمراتب است. در ادامه به طور مختصر در این باره صحبت میکنیم:
اولین قدم در مدلسازی دادههای OLAP، شناسایی نیازمندیهای کسبوکار است. این مرحله شامل انواع گزارشها و دادههایی است که در ادامه مورد بررسی و تجزیهوتحلیل قرار خواهند گرفت.
مرحله دوم در مدلسازی داده OLAP، تعریف ابعاد داده است. بعد مجموعهای از ویژگیهایی مانند زمان، محصول، مشتری و مکان است که جنبه خاصی از کسبوکار را توصیف میکند. هر بعد دارای یک ساختار سلسلهمراتبی است که کاربران را قادر میسازد تا سطوح دقیقتری از جزئیات دادهها را بررسی کنند.
مرحله سوم در مدلسازی دادههای OLAP طراحی جداول واقعیت است. جدول واقعیت شامل معیارهای عددی مانند فروش، درآمد و سود است. هر جدول واقعیت با یک یا چند بعد مرتبط است که کاربران را قادر میسازد تا تجزیهوتحلیل چند بعدی را به طور همزمان انجام دهند.
مرحله چهارم در مدلسازی دادههای OLAP، پیادهسازی سلسلهمراتب است. سلسلهمراتب کاربران را قادر میسازد تا سطوح دقیقتری از جزئیات را در هر بعد بررسی کنند. سلسلهمراتب همچنین به کاربران امکان میدهد تا دادهها را به سطوح بالاتری از جزئیات برای تجزیهوتحلیل انبوه جمع کنند.
سخن پایانی
در این مقاله از سری مقالات هوش تجاری، شما را با لایه های اصلی BI آشنا کردیم. بهعنوان جمعبندی باید بگوییم که هوش تجاری از سه لایه اصلی تشکیل شده است. منبع داده، استخراج پالایش و بارگذاری (ETL) و همچنین انبار داده است. هر کدام از این لایه های اصلی BI فرایند خاصی را از تجزیهوتحلیل دادههای تجاری انجام میدهند و فعالیت آنها به یکدیگر وابسته است. همچنین پردازش تحلیلی آنلاین یا OLAP را داریم که بهعنوان زیرمجموعهای از انبار داده به ما کمک میکند تا تجزیهوتحلیل چند بعدی دادهها را داشته باشیم.
در پایان باید خاطرنشان کنیم که در سری مقالات هوش تجاری وبلاگ، ما به بررسی کامل مفاهیم و ابزارهای هوش تجاری خواهیم پرداخت. در این صورت اگر به یادگیری کامل هوش تجاری تمایل دارید، دعوت میکنیم تا به مطالعه بقیه مقالات وبلاگ ما نیز بپردازید.