مدونة نسيج

التنبؤ بمستقبل علم المكتبات والمعلومات باستخدام تحليل السلاسل الزمنية

Written by هيام حايك | 29/12/2020 07:18:19 ص

تستفيد عدد من الشركات من التعلم الآلي والتحليلات التنبؤية كجزء من خططها الاستراتيجية للتنبؤ بالطلب ، ويستند جزء كبير من هذه النمذجة إلى مجموعات البيانات التاريخية ؛ التنبؤ بالمستقبل يقوم بناءً على الاتجاهات المتأصلة في الملاحظات السابقة. وبالرغم من أن نماذج التنبؤ قد تعمل على النحو الأمثل خلال دورات المبيعات الموسمية، إلا أننا نجد أن التنبؤ هو أحد الأساليب المطبقة في العديد من الدراسات في مجال علم المكتبات والمعلومات (LIS) لأغراض عديدة.

 التنبؤ في مجال علم المكتبات والمعلومات (LIS)

تنبأ ديريك جيه دي سولا برايس Derek J. de Solla Price عالم الفيزياء البريطاني، والذي يعد أبا لعلم قياسات العلوم، منذ أكثر من نصف قرن أنه إذا استمر النمو المتضاعف لمصادر المعلومات ، فيمكن أن يكون لدينا مليون مجلة أكاديمية بحلول عام 2000. اليوم العدد الإجمالي الحالي للمجلات النشطة المنشورة في جميع أنحاء العالم هو 380،299 مجلة. وعلى الرغم من أننا لم نصل إلى عدد المجلات الذي يقدره برايس ، إلا أن المخرجات العلمية لا تزال تتزايد بسرعة ، والعلم أكثر صعوبة من أي وقت مضى. في الواقع ، لم يتم الاستشهاد بـ 90٪ من الأوراق البحثية مطلقًا ، و50٪ من الأوراق البحثية المنشورة لا يقرأها أبدًا أي شخص آخر غير المؤلفين والمراجعين والمحررين.

سوف نستعرض في هذه التدوينة بعض من نتائج الدراسة التي نشرها موقع Springer LINK في منتصف ديسمبر 2020، بعنوان: " التنبؤ بمستقبل علم المكتبات والمعلومات ومجالاته الفرعية". والتي أشارت إلى انه وعلى الرغم من أن مجال LIS من المجالات الصغيرة نسبياً، إلا أنه يحتوي على العديد من المجالات الفرعية، وتختلف خصائص هذه المجالات الفرعية عن بعضها البعض من حيث النشر وأنماط الاقتباس وأنماط الاستشهاد بها والتأليف الهياكل وترددات الإنتاج ، إلخ. إلى جانب ذلك ، فإن تطوير الحقول الفرعية يتأثر بشكل مباشر بالوقت والاتجاهات. على سبيل المثال ، زاد عدد المقالات المكتوبة باستخدام مصطلحات مثل "تكنولوجيا المعلومات" أو "تحليل الشبكة الاجتماعية" أو "الاستشهادات" . اعتمدت هذه الدراسة على استخدام فهارس Web of Science الأساسية كمصدر للبيانات ، كما وتم فحص 123،742 مقالة بعمق لتحليل السلاسل الزمنية. علاوة على ذلك ،أظهرت هذه الدراسة أن:

  • عدد المنشورات والمراجع والاستشهادات سيزداد بشكل كبير في المستقبل، ومن المتوقع أن يعمل المزيد من العلماء معًا.
  • تظهر الموضوعات المستقبلية في مجال LIS تنوعًا مذهلاً من الأخبار المزيفة إلى المجلات الاستغلالية predatory journals والحكومة المفتوحة والتعلم الإلكتروني والسجلات الصحية الإلكترونية. ومع ذلك من المهم تجاوز الأرقام وفهم أنماط النشر والاستشهاد في المجال وتطوير سياسات البحث وفقًا لذلك
  • عدد المنشورات والاستشهادات ستستمر في الزيادة كل عام ما لم يكن هناك تغيير في أنظمة تقييم البحث. قد يؤدي هذا إلى كتلة لا يمكن السيطرة عليها من المنشورات في مجال LIS.
  • من الصعب التنبؤ بمستقبل المجالات الفرعية لأن اتجاهات النشر في المجالات الفرعية تختلف اختلافًا كبيرًا عن الإطار العام. إذا استمرت الأنظمة الحالية ، فسوف تستمر عدم المساواة بين المجالات الفرعية

من أهم النتائج التي تم الكشف عنها في هذه الدراسة الزيادة المتوقعة في عدد المنشورات والاستشهادات والمراجع. بالنظر إلى أن التقييمات تتم باستخدام بيانات الاقتباس كما أن الكمية المتزايدة من البيانات ستجعل التقييمات المستقبلية أكثر صعوبة. لهذا السبب ، قد تكون البرامج الداعمة مثل مبادرة الاقتباسات المفتوحة ، والتي تهدف إلى تعزيز التوفر غير المقيد لبيانات الاقتباسات العلمية ، مفيدة أيضًا لإدارة البيانات في المستقبل. كما أظهرت النتائج أنه سيستمر إنتاج الكثير من الأوراق البحثية التي تحتوي على قوائم مراجع طويلة ، وسيعمل المزيد من المؤلفين معًا لكتابة الأوراق. كما من المتوقع أن نماذج النشر وأنظمة المكافآت وأدوات القياس وأنظمة مراجعة الأقران ستتغير قريبًا.

 استخدام تحليل السلاسل الزمنية للتنبؤ بمستقبل علم المكتبات والمعلومات

السلسلة الزمنية:(Time series) مجموعة من القياسات المسجلة لمتغير واحد أو أكثر مرتبة وفق حدوثها في الزمن وتعطي قيم ظاهرة محددة . ويعتمد أسلوب تحليل السلاسل الزمنية على تتبع الظاهرة (أو المتغير) على مدى زمني معين (عدة سنوات مثلاً) ثم يتوقع للمستقبل بناءً على القيم المختلفة التي ظهرت في السلسلة الزمنية وعلى نمط النمو في القيم، وبهذا فهو يتفوق على الأسلوب التقليدي تركز الدراسات الببليومترية باستخدام تحليل السلاسل الزمنية على تقييمات البحوث والمؤشرات الببليومترية والتصورات العلمية. تم استخدام تقنيات تحليل السلاسل الزمنية في الدراسات الببليومترية منذ أوائل التسعينيات ، ولا تزال إحدى الطرق المفضلة في الأدبيات.

كما تم استخدام تحليلات السلاسل الزمنية في الأوراق الخاصة بالمعلومات الصحية. في السنوات الأخيرة ، ركزت الدراسات في المعلومات الصحية على تقييم السجلات الصحية الإلكترونية ، والتنبؤ بالمخاطر الصحية ، وتحسين قواعد التنبيه للتفاعل بين الأدوية والعقاقير باستخدام السجلات الصحية الإلكترونية ، وفهم المعلومات- البحث عن سلوكيات حول مواضيع صحية ومراقبة مناقشات الصحة العقلية على Twitter.

لقد شهد العالم بأسره مدى أهمية التنبؤات طويلة وقصيرة المدى بشأن القضايا الصحية خلال COVID-19. ومن المتوقع أن نشهد طفرة في النشر في هذا المجال في المستقبل. بدأت الدراسات التي تضع تنبؤات حول مختلف القضايا المتعلقة بـ COVID-19 مع بداية انتشاره. وعلى الرغم من وجود العديد من "الأمور المجهولة" حول الفيروس ، فمن المرجح أن يكون تحليل السلاسل الزمنية أكثر شيوعًا بين صانعي السياسات من خلال توفير مجموعة من السيناريوهات

تطور دقة التنبؤات باستخدام تحليلات السلاسل الزمنية

بينت الدراسات أن عدد المنشورات ليس له اتجاه منتظم. وبالتالي ، هناك احتمال ألا يكون هناك عملية تنبؤ دقيقة بعدد المنشورات المستقبلية. على سبيل المثال لو كان الاتجاه حتى عام 1950 قد استمر حتى اليوم ، فإن عدد المنشورات في أدب LIS اليوم سيكون 37،049 (30 ٪ من العدد الفعلي اليوم). إذا تم استخدام البيانات من عام 1970 ، فسيكون الرقم 76612 (61٪ من الرقم الفعلي اليوم) ، وإذا تم استخدام البيانات من عام 2000 ، فسيكون الرقم 117336 (94% من العدد الفعلي اليوم).

في حين أنه من الممكن القول إن التوقعات في السنوات الأخيرة كانت أكثر دقة ، أي أن اتجاهات النشر كانت متشابهة في السنوات الأخيرة ، ينبغي توقع استمرار عدم القدرة على التنبؤ بغض النظر عن أي تغييرات في أنظمة تقييم أداء البحث. إلى جانب ذلك ، يجب أن يوضع في الاعتبار أن عدد المنشورات قد يتأثر بشكل غير مباشر بقضايا ناشئة غير متوقعة مثل COVID-19 التي تؤثر بشكل كبير على أنماط نشر المؤلفين.

تمت إضافة مجموعة جديدة تسمى "COVID-19" إلى أدبيات LIS . فوفقًا لقاعدة بيانات COVID-19 العالمية للبحوث التابعة لمنظمة الصحة العالمية، والتي تم إنشاؤها في 2020، تم نشر ما مجموعه 123،959 منشورًا اعتبارًا من يوم تفشي المرض حتى 7 نوفمبر 2020. تعد وسائل التواصل الاجتماعي ، والتحقق من الحقائق ، والمسؤوليات الحكومية أثناء الوباء مثل الاتصال السياسي ، والشفافية والمشاركة ، والصحافة الرقمية والأخبار المزيفة من الموضوعات المهمة في مجال LIS التي تم تناولها مؤخرًا. تثبت المجموعة أهمية أبحاث LIS التي تركز على المعلومات المفتوحة والصحيحة في جميع أنحاء العالم أثناء الجائحة.

لوحظت آثار COVID-19 أيضًا في تزايدت في مجموعات المكتبات مثل التعلم الإلكتروني والموارد الإلكترونية)، كما تلعب محو الأمية المعلوماتية دورًا حيويًا بين الباحثين والطلاب والجمهور خلال مجموعة بيانات COVID-19. المعلومات الصحية في LIS تركز العديد من الدراسات في هذا المجال الفرعي على الفئات المحرومة في السنوات الأخيرة. يمكن تقييم الدراسات حول عدم المساواة واللاجئين والأجناس في هذا المحتوى. كما أن وصول الجمهور إلى المعلومات الصحية والاتصالات الصحية والسجلات الصحية الإلكترونية هي مواضيع شائعة وتتعلق بجائحة COVID-19.

تقدير العدد المستقبلي للمنشورات والاستشهادات

مجال مهم آخر للبحث التنبئي هو تقدير العدد المستقبلي للمنشورات والاستشهادات باستخدام أدوات وتقنيات ووجهات نظر مختلفة، نستعرض منها ما يلي:

  • في عام 1990 تم تقدير الأداء الوطني لدول الجماعة الاقتصادية الأوروبية والولايات المتحدة باستخدام نماذج تحليل السلاسل الزمنية. وجد أنه من الممكن التنبؤ بإحصائيات النشر في العام التالي.

  • في عام 1994 تم اقتراح نموذجًا أسيًا مزدوجًا لعمليات الاقتباس الأولى. كان يهدف إلى إيجاد نموذج للاقتباسات الأولى ، واقترح نموذجين للتنبؤ بالعدد الإجمالي للمقالات في مجموعة ثابتة سيتم الاستشهاد بها على الإطلاق.

  • في عام 2003 طور Burrell نظرية النماذج العشوائية للتنبؤ بأنماط الاستشهاد المستقبلية للأوراق الفردية. وجد أن عدد الاقتباسات المتوقع كان دالة خطية للعدد الحالي ، مما يثبت المصطلح "النجاح يولد النجاح".

  • في عام 2012 اقترح Chen نموذجًا نظريًا وحسابيًا للتنبؤ بالاستشهادات المستقبلية باستخدام ثلاثة مقاييس: معدل تغيير النموذج ، والربط العنقودي ، والتباعد المركزي. تشير النتائج إلى أن النموذج يمكنه التنبؤ بالاستشهادات المستقبلية بنجاح.

  •  في عام 2006 تم اقتراح استخدام التجميع ورسم الخرائط وتشكيل السلسلة لتتبع مجالات النمو والتنبؤ بها في العلوم.

  • في عام 2013 تم تطوير نموذجًا جديدًا لاكتشاف النقاط الساخنة التكنولوجية الجديدة من خلال تجميع بيانات الاقتباس من البراءات. وبالمثل ، تم استخدام نموذجي Bass و ARIMA ، وهما نموذجان لتحليل السلاسل الزمنية ، للتنبؤ باتجاهات التنمية بناءً على بيانات براءات الاختراع.
  • في عام 2020 تم الإشارة إلى أنه يمكن تحديد الاختراعات الواعدة من خلال النظر في عدد الاستشهادات السابقة باعتبارها رابطًا مع المعرفة السابقة. توضح كل هذه الدراسات أنه لا يمكن استخدام تحليل السلاسل الزمنية فقط للتنبؤ بعدد المخرجات في الأدبيات ولكن أيضًا للتنبؤ بالتطورات التكنولوجية.

بالنظر إلى عدد دراسات التنبؤ في الأدبيات ، توفر التنبؤات نتائج مهمة للباحثين وواضعي السياسات والمديرين العاملين في LIS ومجالاته الفرعية. من خلال هذه النتائج ، من الممكن تطوير السياسات ، وتحديد الممارسات الإشكالية وقياس آثار تغييرات السياسة.

إن توقع المستقبل على أساس الماضي لا يخلو من القيود. سواء كان وباءً في عام 1918 أو أزمة اقتصادية في عام 2008 ، يمكن للأحداث واسعة النطاق غير المتوقعة أن يتردد صداها في الاقتصاد العالمي لأشهر وحتى سنوات. قد يكون من الممكن أخذ الدروس المستفادة خلال هذه الأزمة وتطبيق مفاهيم التنبؤ هذه على اضطرابات السوق المستقبلية والاستفادة من تقنيات متطورة مثل تعلم الآلة والذكاء الاصطناعي. ولكن لسوء الحظ ، لا أحد يعرف ما سيحدث ، فلم يتخيل أحد حتى حدوث اضطراب مثل COVID-19 قبل عام ولو حتى في الخيال.