مدونة نسيج

أفضل ممارسات المعالجة التحليلية للبيانات في الجامعات

Written by وليد جميل | 21/09/2014 08:33:00 ص

يحتاج الواحد منا إلى أداة فعالة لرؤية البيانات عند اتخاذ قرارات حاسمة بشأن البيانات المعقدة. لقد أصبحت المعالجة التحليلية على الخط المباشر من أشهر أدوات التحليلات المتطورة للمعلومات متعددة الأبعاد. وفي نظام التقارير التحليلية ولوحات المعلومات للجامعات Argos، يعتبر محرك المعالجة التحليلية على الخط المباشر سريعا وبديهيا بصور لم يسبق لها مثيل، ولعل أصعب جزء فيه هو تفسير المعلومات التي يوفرها. في هذه التدوينة، نقدم لكم بيئة المعالجة التحليلية على الخط المباشر، ونستكشف معكم أفضل الممارسات المتبعة عند تصميم وتطوير قوالب هذه المعالجة التحليلية لعملائنا.

في البداية، لا بد أن نتعرف على بعض المصطلحات الهامة:

المعالجة التحليلية على الإنترنت (On-Line Analytical Processing (OLAP: هي البنية التقنية الأساسية التي يتم توظيفها لتوفير إمكانيات استعلام مخصصة للمستخدم وتحليلات متعددة الأبعاد.

مقياس Measure أو الواقع Fact: يعني القيمة الرقمية قيد التحليل: تعداد الأفراد، الإيرادات، معدل الدرجات، تقديرات اختبار القبول بالمدرسة... وغيرها.

الامتداد Dimension: هي المستودعات التي يجرب حفظ المقاييس فيها، لأغراض تحليلها، وتشفير مصطلحاتها، وفهرستها حسب السنة، والشهر، والفصل، والتوزيع الديمغرافي الحيوي، والمنطقة الجغرافية... إلخ.

مستوى الدقة Level of Granularity: أعمق وأدق مستوى من التفاصيل تحتوي عليه مجموعة البيانات في المعالجة التحليلية.

لاحظ: مثلا، عند توافر قالب معالجة تحليلية عن أحد الطلاب باعتباره "مستوى الدقة"، فإن هذا يعني مقدرة عضو هيئة التدريس على تحليل المعلومات المتوافرة عن الطلاب فرادى، مثل معدل الدرجات، وتعداد الطلاب، ونتائج الاختيارات، إلا أنه لا يمكن الاطلاع على المساق الدراسي الخاص بالطالب لأنه بمقدور طالب واحد التسجيل في أكثر من مساق دراسي. لتحليل معلومات المساق الدراسي، تحتاج إلى تعيين مستوى الدقة في المعالجة التحليلية وصولا إلى مستوى البرنامج الدراسي.

ما هي المعالجة التحليلية على الإنترنت؟

هي عبارة عن محرك إجابة يهدف إلى تمكين الكوادر غير الفنية بالوصول إلى الإجابات التي يبحثون عنها. يتم هذا عن طريق تجميع المقاييس في مجموعات منطقية، وإتاحة أدوات تشريح البيانات إلى فئات متعددة من خلال مستودعات حفظ البيانات. إنها تعمل على تطوير آلية لوضع تقارير طولية "تحليل البيانات عبر الوقت" وكذلك تحليل الاتجاهات. تبدا الأسئلة التي تركز عليها المعالجة التحليلية للبيانات ببعض الأسئلة النمطية مثل: "How many" للسؤال عن العدد، و How much للسؤال عن الكم، و what is the average للسؤال عن معدل التقديرات والدرجات.

إجراءات التصميم و أفضل الممارسات

أول خطوة عند تصميم قالب للمعالجة التحليلية على الخط المباشر هي تحديد مستوى الدقة، ومقاييس القالب، ومستودع تخزين بيانات القالب. هذه الخطوة هامة لأنه عند محاولة دمج مستودعات التخزين والمقاييس في القالب المتباين مع مستوى الدقة سوف يسفر عن حسابات غير دقيقة، ومن ثم تفتقر الإجابات إلى الدقة. مثلا، لنفرض أنك ترغب في تعداد الطلاب بناء على الفصل الدراسي إلا أنك قمت بتعيين مستوى الدقة على المساق الدراسي. عندها يتم تعداد كل طالب سجل في أكثر من مساق دراسي أكثر من مرة. مما يؤدي إلى تضارب في النتائج وعدم دقتها، ولا بد من مراعاة مثل هذا الأمر عند تطوير المعالجة التحليلية.

ثم نقوم بتحديد المقاييس ومستودعات البيانات التي نحتاج إليها. أفضل طريقة للقيام بهذا هي أن توجه إلى مجموعات المستخدمين المستهدفة الأسئلة التالية:

  1. ما هي أكثر ثلاثة أسئلة تطرح عليك يتعين على قالب المعالجة التحليلية الإجابة عليها؟
  2. ما هي الالتزامات أو المتطلبات الحكومية أو القانونية - إن وجدت - المتعلقة بهذه البيانات؟

تبدو الإجابة على هذه الأسئلة كما يلي:

  1. ما هو التعداد الغير مكرر على مستوى الفصل الدراسي، النوع، مادة التخصص؟
  2. ماذا كان معدل الاحتفاظ بالطلاب في العام الماضي؟

عند استخدام الإجابات السابقة، يمكنك تطوير تحليل مفصل لمقياس وامتداد مستودع حفظ البيانات كما في المثال التالي:

المقياس: معادل الدوام الكامل FTE؛ الامتداد: السنة، الفصل الدراسي، النوع، العمر، القسم، التخصص، كود المنطقة.

المقياس: معدل الاحتفاظ بالطالب، الامتداد: السنة.

المقياس: تعداد الطلاب، معادل الدوام الكامل، وساعات الاعتماد؛ الامتداد: السنة، الفصل الدراسي، الموضوع، رقم المساق الدراسي.

عند اختيار الأسئلة التي يحتاج المستفيدون إلى الإجابة عليها، يمكنك تحديد نوع تصميم مجموعة البيانات المستخدمة لتطوير المعالجة التحليلية الجاري تصميمها..

حان الآن وقت كتابة الاستعلام المطلوب لسحب المقاييس والامتدادات كما هو موضح من قبل. هذا الجانب سهل مع قوالب المعالجة التحليلية حيث أنها لا تتطلب أية تجميعات أو تراكمات (يقوم محرك المعالجة بمباشرة هذا الأمر). النموذج التالي يوضح المقاييس والامتدادات المطلوبة للسؤال الأول أعلاه.
لاحظ: تم كتابة الاستعلام ليتوافق مع نظام معياري لمعلومات الطلاب والذي يتضمن المواد التي يدرها الطلاب.

كما هو واضح، لا يقدم الاستعلام أية تجميعات. إنه يسرد كل الطلاب المسجلين في نظام معلومات الطلاب، ويقود بإدخال هذه البيانات إلى قالب المعالجة التحليلية. يستخدم القالب صف البيانات الأولية لبناء تقارير متعددة الامتدادات، مما يمكن المستخدم من طرح الأسئلة وتحليل مجموعة البيانات.

هذا مجر مثال على الأسئلة التي تساعد قوالب المعالجة التحليلية على تقديم إجابة لها، مما يوضح قوة ومتانة هذه الخاصية في تحليل البيانات. لكم عانينا كثيرا للإجابة على الأسئلة الصعبة، مما يجعل قوالب المعالجة تستحق الاهتمام الكافي لاستكشاف ما توفره من قدرات وما تطرحه من إمكانات.

ما هي أهم الأسئلة التي ساعدتك قوالب المعالجة في الإجابة عليها قوالب المعالجة لتحليل البيانات في مؤسستك الأكاديمية؟

مترجم عن Zach heath لـ Evisions