لجنة التربية و التعليم العالي و البحث العلمي

أدوات التنقيب ومستودعات البيانات (الحلقة الخامسة)

أ. د. مرتضى محمد حمد / اختصاص علوم حاسبات

عضو لجنة التربية والتعليم العالي والبحث العلمي

المنتدى العراقي للنخب والكفاءات

 

في العقود الماضية، أنفقت الشركات الوقت والمال لاكتشاف معلومات مهمة عن نفسها وعملائها ومنافسيهم، بسبب الكميات الهائلة من البيانات المتوفرة في العلوم والأعمال والصناعة والعديد من المجالات الأخرى، وبسبب التقدم السريع في تقنيات الحوسبة والرقمنة. قد يوفر التوفر الواسع لمثل هذه الكميات الضخمة من البيانات في شكل إلكتروني موارد غنية لاكتشاف المعرفة ودعم القرار ، حيث تستثمر العديد من الشركات الموارد في اكتساب وتمثيل ومعالجة المعرفة لاتخاذ قرارات ذكية .

في الوقت الحاضر ، أصبحت المعرفة المورد الرئيسي لقوتها الاقتصادية. حيث إنه العامل الرئيسي للمنظمات لاكتساب مزايا تنافسية . إن الاحتفاظ بالمعرفة وتطبيقها يمكّن المنظمة من النجاح في المواقف التنافسية.

من أجل فهم كمية هائلة من البيانات وتحليلها والاستفادة منها في نهاية المطاف كما هو الحال في مستودع البيانات (DW) ، تستخدم الشركات تقنيات التعدين للبحث في كميات هائلة من البيانات للحصول على البصيرة والمعرفة الحيوية. تُستخدم أدوات التعدين مثل التنقيب عن البيانات ، والتنقيب عن النصوص ، والتنقيب على الويب للعثور على المعرفة المخفية في قواعد البيانات الكبيرة أو الإنترنت. أدوات التعدين هي أدوات برمجية آلية تُستخدم لتحقيق ذكاء الأعمال من خلال إيجاد العلاقات المخفية (القواعد) ، والتنبؤ بالأحداث المستقبلية من كميات هائلة من البيانات . التنقيب في البيانات (DM) هي عملية تحديد أنماط مثيرة للاهتمام من قواعد البيانات الكبيرة. تمت معاملة DM بشكل عام كمرادف لاكتشاف المعرفة في قواعد البيانات ، على الرغم من أن بعض الباحثين ينظرون إلى DM كخطوة أساسية لاكتشاف المعرفة .

في حين أن هناك كميات هائلة من بيانات المبيعات لسنوات عديدة في سوق عناصر البناء التي استخدمناها والمليئة بالمعرفة القيمة ، بالإضافة إلى الحاجة الضرورية لاكتشاف المعرفة المخفية من بيانات المبيعات والمتمثلة بالنسب المتوقعة لعناصر المبيعات لمساعدة مدير السوق على اتخاذ قرارات بشأن تحديد عدد المتاجر والعاملين والأصناف المراد استيرادها أو شراؤها لإدارة أصناف السوق (التخزين والاسترجاع والبيع). في هذه الأطروحة ، نستخدم تقنية DM لتحليل الكميات الهائلة من بيانات السوق ، لأن الهدف من DM هو السماح للشركة بتحسين عمليات التسويق والمبيعات ودعم العملاء من خلال فهم أفضل لعملائها وعناصرها [7]. على وجه التحديد ، نستخدم وظيفة الارتباط الخاصة بـ DM للعثور على العلاقات بين المنتجات (العناصر) التي تم شراؤها للحصول على معرفة بالعناصر المتوقعة التي سيتم بيعها والتي تساعد مدير السوق في اتخاذ القرار بشأن إدارة السوق. لأن تعدين قواعد الارتباط (association rules) هو واحد من أهم المهام في DM , اذن تعتبر أداة قوية لتحليل سلة السوق التي تهدف إلى التحقيق في سلوك التسوق للعملاء على أمل العثور على الانتظام. تعد قواعد الارتباط أداة قيمة تم استخدامها على نطاق واسع في العديد من الصناعات مثل محلات السوبر ماركت, والطلب عبر البريد, والتسويق عبر الهاتف, والاحتيال في التأمين, والعديد من التطبيقات الأخرى حيث يتم استهداف العثور على الأمور المنتظمة .

في DM ، يعد إعداد البيانات أمرًا مهمًا في الوقت الحاضر. نظرًا لوجود حجم ضخم من البيانات ولكن اغلبها لا علاقة لها بالهدف أو أن بعض البيانات زائدة عن الحاجة أو غير متناسقة ، مما يؤدي إلى زيادة استهلاك طاقة المعالجة وتوليد نتائج خاطئة. لذلك نستخدم المعالجة المسبقة للبيانات وتقنيات التنظيف مثل تقليل البيانات وحل التناقض لتنظيف وإعداد بيانات المبيعات لعملية التعدين ولتوفير بيانات عالية الجودة للحصول على معرفة جيدة.

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى