ما هو مستودع البيانات؟
أ.د. مرتضى محمد حمد / اختصاص علوم حاسبات
رئيس لجنة التربية والتعليم العالي والبحث العلمي
المنتدى العراقي للنخب والكفاءات
مستودع البيانات عبارة عن قاعدة بيانات مصممة لتمكين أنشطة ذكاء الأعمال: فهي موجودة لمساعدة المستخدمين على فهم أداء مؤسستهم وتحسينه. إنه مصمم للاستعلام والتحليل وليس لمعالجة المعاملات، وعادةً ما يحتوي على بيانات تاريخية مستمدة من بيانات المعاملة، ولكن يمكن أن يتضمن بيانات من مصادر أخرى.
تفصل مستودع البيانات مهمة عمل التحليل عن مهمة عمل المعاملة، كما تمكن المؤسسة من دمج البيانات من عدة مصادر. وهذا يساعد في:
• الحفاظ على السجلات التاريخية
• تحليل البيانات لاكتساب فهم أفضل للأعمال وتحسين الأعمال.
بالإضافة إلى قاعدة البيانات العلائقية، يمكن أن تتضمن بيئة مستودع البيانات ملف الاستخراج والنقل والتحويل والتحميل (ETL) والتحليل الإحصائي وإعداد التقارير وقدرات استخراج البيانات، وأدوات تحليل العميل والتطبيقات الأخرى التي تدير عملية جمع البيانات وتحويلها إلى معلومات مفيدة وقابلة للتنفيذ وتسليمها إلىالمستخدمين المعنيين.
لتحقيق هدف ذكاء الأعمال المعزز، يعمل مستودع البيانات مع البيانات التي تم جمعها من مصادر متعددة. قد تأتي بيانات المصدر من الأنظمة المطورة داخليًا والتطبيقات المشتراة ومجمع بيانات الجهات الخارجية، ومصادر أخرى. قد يشمل المعاملات والإنتاج، والتسويق، والموارد البشرية،والمزيد. في عالم البيانات الضخمة اليوم، قد تكون البيانات عبارة عن مليارات من النقرات الفردية على مواقع الويب أو تدفقات البيانات الضخمة من أجهزة الاستشعار المدمجة في الآلات المعقدة.
تختلف مستودعات البيانات عن أنظمة معالجة المعاملات عبر الإنترنت (OLTP). باستخدام مستودع البيانات، يمكنك فصل مهام عمل التحليل عن مهام العمل الخاص بالمعاملات. وبالتالي، فإن مستودعات البيانات هي أنظمة موجهة إلى حد كبير للقراءة. لديهم قدر أكبر بكثير من البيانات للقراءة مقابل الكتابة والتحديث. يتيح ذلك أداءً تحليليًا أفضل بكثير ويتجنب التأثير على أنظمة المعاملات الخاصة بك. فيمكن تحسين نظام مستودع البيانات لدمج البيانات من العديد من المصادر لتحقيق هدف رئيسي:
يصبح “مصدر الحقيقة الوحيد” لمنظمتك. هناك قيمة كبيرة في وجود مصدر ثابت للبيانات يمكن لجميع المستخدمين أن يتطلعوا إليه؛ يمنع العديد من النزاعات ويعزز كفاءة اتخاذ القرار.
عادةً ما يخزن مستودع البيانات عدة أشهر أو سنوات من البيانات لدعم التحليل التاريخي. عادةً ما يتم تحميل البيانات الموجودة في مستودع البيانات من خلال عملية استخراج وتحويل وتحميل (ETL) من مصادر بيانات متعددة. تتجه مستودعات البيانات الحديثة نحو بنية استخراج وتحميل وتحويل (ELT) يتم فيها إجراء كل أو معظم عمليات تحويل البيانات على قاعدة البيانات التي تستضيف مستودع البيانات. من المهم ملاحظة أن تعريف عملية ETL يمثل جزءًا كبيرًا جدًا من جهد التصميم لمستودع البيانات. وبالمثل،فإن سرعة وموثوقية عمليات ETL هي أساس مستودع البيانات بمجرد تشغيله.
يقوم مستخدمو مستودع البيانات بإجراء تحليلات للبيانات غالبًا ما تكون مرتبطة بالوقت. تشمل الأمثلة توحيد أرقام مبيعات العام الماضي وتحليل المخزون والأرباح حسب المنتج والعميل. ولكن مع التركيز على الوقت أم لا، يرغب المستخدمون في “تقطيع وتقطيع” بياناتهم على الرغم من أنهم يرون ذلك مناسبًا، وسيكون مستودع البيانات المصمم جيدًا مرنًا بما يكفي لتلبية هذه المطالب. سيحتاج المستخدمون أحيانًا إلى بيانات مجمعة بشكل كبير، وفي أحيان أخرى سيحتاجون إلى التعمق في التفاصيل. تشمل التحليلات الأكثر تعقيدًا تحليلات الاتجاهات والتنقيب في البيانات،والتي تستخدم البيانات الحالية للتنبؤ بالاتجاهات أو التنبؤ بالعقود الآجلة. يعمل مستودع البيانات كمحرك أساسي تستخدمه بيئات ذكاء الأعمال الوسيطة التي تخدم التقارير ولوحات المعلومات والواجهات الأخرى للمستخدمين النهائيين.