انباره داده ، قلب محیط هوش تجاری (BI) ، یک مخزن مرکزی از دادههاست که از چندین منبع داده متفاوت جمعآوری شده است و به نوبهی خود برای تامین پردازش تجزیه و تحلیل استفاده میشود که ارزش تجاری از آن استخراج میشود. مدیران رده بالا آگاه به تجزیه وتحلیل، ابتدا باید از تفاوتهای انبار داده با مدلهای ساختاری معمولی، موجودیت-ارتباطی و مدلسازی براساس ابعاد دادهها آگاه شوند.
اهمیت مدلسازی داده در یک متن تجزیه و تحلیلی، به همراه مدیریت دادههای ارتباطی مرتبط با آن داده، به عنوان یک مؤلفه بحرانی در محیط هوش تجاری بروز پیدا کرده است. در ادامه، ما به مدلسازی داده، پردازش تحلیلی آنلاین (OLAP) و مدیریت دادههای ارتباطی خواهیم پرداخت، که همگی به شیوههایی برای نمایش اطلاعات به منظور اهداف هوش تجاری مجهز هستند.
تفاوت قابل ملاحظهای بین استفاده سنتی از پایگاههای داده برای اهداف تجاری و استفاده از پایگاههای داده برای اهداف تجزیه و تحلیل وجود دارد. استفاده سنتی در ارتباط با پردازش تراکنش به عنوان وسیلهای برای مدلسازی عملکرد یک کسبوکار است. فرآیندهایی که در اطراف تبدیل یک عملکرد کسبوکار به یک سیستم عملیاتی وجود دارد، بر دو ایده تمرکز دارند:
تکامل سیستمهای پایگاهداده تابع سازمان مدل موجودیت-ارتباطی به منظور ادغام این نوع فعالیتهای تجاری بود. از سوی دیگر، نمایش اطلاعات در این چارچوب مناسب اهداف تحلیلی نیست. اولاً، مدل داده به منظور فرآیند تراکنش بهینهسازی شده است، اما عملکرد تحلیلی به شدت ضرر میکند، و ثانیاً، انعطافاتی که تحلیلگران پایگاه داده به مدلهای خود اعمال میکنند، منجر به ترتیب داده میشود که احتمالاً برای یک تحلیلگر تجاری گیجکننده خواهد بود.
به این منظور، جامعه BI مدل دادهای متفاوت به نام مدل ابعادی (dimensional model) را توسعه داده است که اطلاعاتی که برای اجرای برنامههای تحلیلی و پشتیبانی از تصمیمگیری لازم است را به طریقی موثرتر نمایش میدهد. با استفاده از این نوع مدل داده و ایجاد یک مخزن مرکزی اطلاعات با استفاده از این نوع مدل داده و جمعآوری مجموعههای داده از تمام حوزههای شرکت در این مخزن، میتوان یک انبار داده ایجاد کرد که سپس میتواند اطلاعات را به برنامههای تحلیلی فردی تأمین کند.
دلیل اقتصادی در اینجا ساده است: بدون توانایی جداسازی و فرمولهکردن دادهها برای تجزیه و تحلیل، برنامه BI وجود ندارد، ساخت انبار داده یا فرهنگ دادهها و یک انبار داده نیز نمیتواند بدون درک همه جوانب دادهها ساخته شود.
مدل داده یک نمایش یکسانسازی شده و ساختار یافته از دادهها برای نمایش یک مجموعه از موجودیتهای جهان واقعی است که با یکدیگر ارتباط دارند. در طول زمان، درک ما از بهترین روش نمایش مدل مشاهدهشده ما تغییر کردهاست تا نمایانگر روشهایی شود که ما درک اطلاعات را به همراه روشهایی که میخواهیم برای پردازش آن اطلاعات استفاده کنیم، از این زمینه بهرهبرداری کنیم. تفاوت قابل توجهی بین نحوه استفاده از داده در یک شیوه عملی/تاکتیکی (به عبارت دیگر برای “مدیریت کسب و کار”) و نحوه استفاده از داده در یک شیوه استراتژیک (به عبارت دیگر برای “بهبود کسب و کار”) وجود دارد.
تکنیک مدلسازی سنتی برای سیستمهای عملیاتی مربوط به مدل موجودیت-ارتباط است. متأسفانه، برنامههای تحلیلی مرتبط با BI کمتر قابلیت بهرهبرداری از دادهها را در موقعیت موجودیت-ارتباطی دارند؛ به عبارت دیگر، تغییر همان اطلاعات به یک ساختار بُعدی قابلیت استفاده آسان از دادهها را برای اهداف استراتژیک به شدت سادهتر میکند.
در اوایل دوران پایگاههای داده، تمام جنبههای یک شیء دادهای یا تراکنش (مانند حساب بانکی یا خرید در یک فروشگاه) احتمالاً در یک ورودی واحد در یک جدول پایگاه داده ذخیره میشد، به گونهای که تمام جنبههای نمونه داده داخل آن رکورد تکی قرار میگرفتند. به عنوان مثال، یک رکورد فروش ممکن بود نام خریدار، آدرس، زمان تراکنش و سپس یک لیست (شاید با کاماها جدا شده) از موارد و تعداد هر محصولی که خریداری شده بود را ثبت کند. از نظر مدیریت کسب و کار، این ممکن بود کافی باشد، اما مدیریت آن دشوار بود؛ کد برنامهنویسی برای انجام هر نوع تغییر دادهای لازم برای استخراج هر نوع اطلاعات از این سیستمها نوشته میشد (شکل زیر). به علاوه، از آنجایی که اطلاعات خریدار برای هر تراکنش جمعآوری میشد، مقدار قابل توجهی از دادههای تکراری و تکمیلی بدون دلیل ذخیره میشد و امکان ورود خطاهای بسیاری به سیستم وجود داشت.
در دهه 1980 میلادی، تعدادی از افراد عملی و پژوهشگران مفهوم پایگاه داده رابطهای را بررسی کردند، در آن رویکرد مدلسازی اطلاعات به عنوان نمایندهها در جداول مختلف مورد نظر قرار گرفت و این نمایندهها در سیاق فرآیندهای تجاری میان جداول با استفاده از نوعی پیوند متقاطع در جداول به هم مرتبط میشدند. در دیدگاه ما (سادهشده) درباره پایگاه داده فروش، جدول خود را به جدول مشتری، جدول محصول، جدول فروش و جدول جزئیات فروش تقسیم میکردیم، به طوری که هر رکورد در جدول فروش نمایندهای از یک تراکنش خرید توسط مشتری مرتبط را نشان میدهد و هر مورد و تعداد خریداری شده در یک رکورد مرتبط در جدول جزئیات فروش وجود داشت (شکل زیر).
یکی از اهداف اساسی مدل موجودیت-ارتباط تسهیل توسعه پردازش تراکنشی است، این کار با ارائه یک طرح منطقی برای تطبیق یک فرآیند تجاری با یک دنباله گروهی از عملیات جدولی به عنوان یک واحد کاری انجام میشود. نتیجه اجرای گروه عملیات، بازتاب اثرات تراکنش تجاری درون مدل داده است. هدف اساسی دیگر مدل رابطهای شناسایی و حذف تکرار در دیتابیس است. این فرآیند که با نام نرمالسازی شناخته میشود، جداول را برای یافتن نمونههای تکراری از داده در یک جدول (مانند نامها و آدرسها در جدول فروش قدیمی ما در شکل زیر) که میتوانند به یک جدول جداگانه که از طریق یک کلید خارجی به صورت روابطی ارتباط برقرار کنند، تجزیه و تحلیل میکند.
اگرچه مدل موجودیت-ارتباط به طراحی سیستمهای عملیاتی به شدت کمک میکند، انتشار اطلاعات به انتسابهای رابطهای تا حدی گیجکننده است (به عنوان مثال، نمودارهای موجودیت-ارتباطی به طول راهرو که دیوارهای دپارتمان مدیریت پایگاه داده [DBA] را تزئین میکنند را در نظر بگیرید). علاوه بر این، انواع استخراجهای تحلیلی که برای برنامههای BI مفید هستند، به تمثیل داده در مدل رابطهای خالص محدود میشوند، تبدیل به درخواستهای با عملکرد ضعیف میشوند که شخص ممکن است فکر کند استخراجی به شکل یک عملیات مفهومی خواهد بود.
عدم موفقیت آشکار مدل رابطهای در ارائه به بهرهبرداران دانش بهطور عمده به پیچیدگی مدلهای داده و سختی در بازسازی نمای طبیعی اطلاعات که میتواند در سیاق تحلیلی مورد استفاده قرار گیرد، برمیگردد. به عکس، یک تکنیک جایگزین برای مدلسازی دادهها وجود دارد که امکان نمایش اطلاعات به یک شکل مناسب برای دسترسی با عملکرد بالا را فراهم میکند. این تکنیک، مدلسازی بُعدی(ابعادی) نامیده میشود و واحد اساسی نمایش را به عنوان یک ورودی تککلیدی در یک جدول حقیقت نازک در نظر میگیرد، که هر کلید از مدل رابطهای برای ارتباط با ابعاد مختلف مرتبط با آن حقایق استفاده میکند. جدول واقعیتهای تحت نظر که هر کدام به مجموعهای از ابعاد مرتبط با آنها مرتبط هستند، نمایش کارآمدتری برای دادهها در یک انبار داده فراهم میکند. این به علت قابلیت ایجاد بهصورت کارآمد تجمیعات و استخراج دادههای خاص به محدودیتهای ابعادی خاص، سریع است و به امکان تجمع اطلاعات میپردازد.
نمایش یک مدل بعدی به سادگی انجام میشود. جدول واقعیت شامل رکوردهایی است که به اشیاء قابل مشاهده اشاره دارد، معمولاً در یک سیاق تجاری. یک مثال ساده، در شکل زیر مشاهده میشود که دارای یک جدول واقعیت است که شامل یک کلید با مؤلفههایی است که کلیدهای جداول ابعاد فردی هستند، همراه با برخی اطلاعات خاص مرتبط با واقعیت است. این دادهها به طور معمول عددی هستند تا قابلیت استفاده از توابع تجمیعی (مجموع، بیشینه، کمینه و غیره) را داشته باشند. هر واقعیت مقدار کلی محصولی که به یک مشتری خاص در مکان خاص نقاط فروش در زمان خاصی فروخته شده را نمایان میکند.
این مدل شامل چهار بُعد است: محصول، مشتری، مکان نقاط فروش و زمان. زمانی که به تصویر مدل در شکل بالا نگاه میکنید، میبینید که ارتباطات بین جدول واقعیت و ابعاد شبیه به یک ستاره است، به همین دلیل این ساختار مدل به عنوان یک طرح ستارهای یا یک طرح ستاره نامیده میشود. با نگاه به این مدل، به راحتی میتوانید ببینید که چگونه مجموعههای مستقیم میتوانند با جمعآوری اطلاعات از طریق جدول واقعیت تشکیل شوند. به عنوان مثال، برای استخراج اطلاعات در مورد فروش هر محصول خاص بر اساس مکانهای فروش، شما باید رکوردهای جدول واقعیت را بر اساس مکان فروش و سپس بر اساس محصول گروهبندی کنید.
جدول واقعیت با ابعاد در یک طرح ستارهای مرتبط است. هر ورودی در یک بُعد نمایانگر توصیف ساختارهای فردی درون آن بُعد است. به عنوان مثال، در مثال فروش ما، بُعد محصول حاوی اطلاعات مرتبط با محصولات است، با توصیفهای متنی که هر محصول را به دقت توصیف میکنند، مانند گروه محصول، توضیحات، شماره SKU، نوع بستهبندی و اندازه بسته.
استفاده از یک مدل بُعدی برای مدیریت دادهها در یک انبار داده مجموعهای از مزایا را داراست:
تغییراتی در طرح ستاره وجود دارد که شامل جداسازی اطلاعات بُعدی از یک بُعد پیشفرض (که به آن snowflaking میگویند) است، اما طرح ستاره کلی یک تجسم نمایشی قدرتمند است که در ساخت انبار دادهها شایع است. مدلسازی بُعدی به یک انبار داده محدود نمیشود؛ میتوان به راحتی تصور کرد که از همین رویکرد برای نمایش انواع مختلفی از فعالیتهای تجاری استفاده شود، مانند مدلهای زنجیره تأمین، ادعاهای بیمه، پروندههای پزشکی و جزئیات تماسهای تلفنی.
شرکت داده های هوشمند ساویس با هدف کمک به طراحی، توسعه و رشد محصول و کسب و کار خدمات متفاوتی ارائه میکند. با توجه به اینکه مجموعه شما چه ابعاد و نیازهایی دارد، برنامه همکاری و سرویسدهی به شما بطور منحصر بفرد طراحی و بصورت پروپوزال به شما ارائه میشود. با توجه به اهداف هوش تجاری و موارد مطرح شده در این مطلب میتوانید با استفاده از داشبوردهای هوش تجاری، کسب و کار خود را ارتقاء دهید.
ما در مطالب بعدی، در رابطه با انبارهی داده، دیتا مارت،متاداده و اهمیت آن به مواردی اشاره خواهیم کرد؛ امید است که ارائه این مطالب شما را به شناخت بهتر هوش تجاری نزدیک کند و بتواند موفقیتی برای کسب و کار شما باشد.