عن مدونة نسيج

تهدف مدونة نسيج الى توفير مساحات تشاركيه تتسع لكل المتخصصين والمهتمين بكل ما هو جديد في مجال المكتبات والتعليم العالي والتعلم عن بعد وتقنيات المعلومات والاتصالات وتقنيات الأرشفة وحلول المعرفة المتقدمة في التعليم العالي، المكتبات، ومراكز الأبحاث.

سجل بريدك الالكتروني هنـا لتصلك أحدث التدوينات

أكاديمية نسـيج على الفيسبوك

 
 

مقــالات حديثة

الدور الحيوي للمكتبات والمستودعات البحثية في إدارة البيانات الضخمة: الجزء الثاني

نُـشر بواسطة هيام حايك on 18/01/2018 11:53:06 ص

2 (3).jpg

البيانات هي موضوع ساخن بالنسبة لأولئك العاملين في مجال البيانات والمعلومات: الجميع يتحدث عن البيانات الضحمة. فالجميع يعتقد أنه يجيد التعامل معها. والذي لا شك فيه أن البيانات الضخمة مجال يستحق الخوض فيه. فالبيانات الضخمة غير موجودة في فراغ؛ فهي تشكل وتتشكل من عمليات اجتماعية أوسع، واقتصادات، وهويات، وتحيزات، وعلاقات قوة متأصلة. ولكنها لا تعمل وحدها لتحديد شكل المجتمع. فالتقنية توفر إمكانات وطرق يمكن للمستخدمين من خلالها اعتماد التقنية وتكييفها لأغراض وجمهور لم تكن موجهة أصلا إليه. وفي الجزء الأول من التدوينة تم مناقشة البيانات والمستودعات البحثية بصفة عامة، هنا سوف نتعرف على خدمات البيانات البحثية التي يمكن أن تقدمها المكتبة في هذا الصدد.

المكتبات في خدمة مجتمع الباحثين

بدأت العديد من المكتبات التي تخدم المجتمعات البحثية في تطوير الخدمات لدعم احتياجات الباحثين المتعلقة بالبيانات. قد يكون تطوير مثل هذه الخدمات أمرا ليس بالسهل بالنسبة للمكتبات التي بدأت للتو بتقديم مثل هذه الخدمات؛ ولكن تأطير الخدمات ضمن نموذج دورة حياة بيانات البحث يمكن أن تكون نهجا مفيدا لتحديد الخدمات التي يجب تطويرها وكيفية تسويقها لمجتمع الباحثين وكيفية قياس نجاح الخدمة.

وبالرغم من وجود مجموعة متنوعة من نماذج دورة حياة بيانات البحوث الا أن ن معظمها يحتوي على المراحل المشتركة التالية:

  • التخطيط، حيث من المحتمل أن يتضمن إنشاء خطة رسمية لإدارة البيانات، لتلبية متطلبات الممولين.
  • جمع البيانات أو الحصول عليها،
  • تحليل البيانات أو تفسيرها تمثيل البيانات مرئيا data visualization
  • حفظ البيانات وتنظيمها
  • تبادل البيانات.

إن فهم كيفية تفاعل الباحثين مع بياناتهم في نقاط مختلفة من دورة حياة البيانات، وكذلك التعرف على النقاط التي تمثل معضلة للباحثين، يمكن أن يساعد المكتبيين على تطوير الخدمات المستهدفة لتلبية الاحتياجات الخاصة للباحثين في مؤسساتهم. وبالإضافة إلى ذلك، توجد موارد متاحة بحرية يمكن أن تكون مفيدة في عدة مراحل من دورة حياة البيانات؛ يمكن لهذه الموارد أن تكون مفيدة للباحثين مباشرة، ولكن قد تكون مفيدة أيضا لأمناء المكتبات الذين لديهم خبرة أقل في العمل مع بيانات البحوث ويودون تطوير هذه المهارات.

  • خطة إدارة البيانات

عندما اعتمدت مؤسسة العلوم الوطنية (NSF) متطلبات خطة إدارة البيانات في عام 2011، كانت واحدة من أول الممولين في الولايات المتحدة التي قامت بذلك. حيث تتطلب سياسة الصندوق الوطني من جميع الباحثين الذين يسعون للحصول علی تمويل من مؤسسة العلوم الوطنية أن یقدموا خطة حول کیفیة جعل بياناتهم متاحة للجمهور وفقا لسياسة مشارکة البيانات الخاصة بمؤسسة العلوم الوطنية وكذلك کیفیة إدارة بياناتهم طوال عمر المشروع. والآن، وبعد سنوات، اتبع العديد من الممولين الاتحاديين والخاصين حذوها، لأن تحديد كيفية تنظيم البيانات وإدارتها وحفظها وتقاسمها يمكن أن يكون خطوة أولى حاسمة في تحديد الإجابة على الأسئلة اللوجستية الحاسمة، مثل مقدار التمويل المطلوب ما نوع وكمية وسائل التخزين الرقمية التي ستكون مطلوبة. وقد بدأت العديد من المكتبات في تقديم الدعم للباحثين الذين يحتاجون إلى كتابة برنامج خطة إدارة البيانات، وتقديم المشورة بشأن كيفية كتابة مثل هذه الوثيقة. وتوفير التوجيه بشأن الكيفية التي يمكن بها مساعدة الباحثين على الوفاء بالتزامات سياسات تقاسم البيانات. ولأن خطة إدارة البيانات هو شرط لكثير من طالبي المنح، فإن تقديم الدعم لخطة إدارة البيانات يبدو وكأنه خطوة أولى منطقية لتدخل المكتبات. وبالإضافة إلى ذلك، فإن تدخل المكتبات في مرحلة التخطيط لعملية البحث يمكن أن يكون أكثر فعالية من محاولة مساعدة الباحثين بعد أن يجمعوا بياناتهم بالفعل ويواجهون مشاكل مرتبطة بممارسات إدارة البيانات السيئة.

  • إعادة استخدام البيانات

الآن وقد بدأ الباحثون في تبادل البيانات الخاصة بهم بحرية أكبر، والمستودعات متاحة على نحو متزايد لتسهيل الوصول إلى تلك البيانات، فإنه من الأسهل للباحثين الاستفادة من البيانات الموجودة التي يمكن إعادة استخدامها لمعالجة الأسئلة البحثية الخاصة بهم. في الواقع، غالبا ما يكون من الممكن للباحثين إجراء دراسة كاملة باستخدام البيانات المتاحة للجمهور وحسب، دون الحاجة إلى توليد البيانات الخاصة بهم. وعلى الرغم من أن بعض النقاد وصفوا أولئك الذين يسعون إلى إعادة استخدام البيانات الموجودة على أنها "طفيليات بحثية" فإن إعادة استخدام البيانات يمكن أن تكون مفيدة في الواقع لمجتمع البحث والجمهور الأوسع. ومن شأن إعادة استخدام البيانات الموجودة لأغراض جديدة أن يزيد من العائد على الاستثمار الأصلي للتمويل؛ وقد وجدت دراسة تمت في عام 2014 أن تبادل البيانات أسفرت عن عوائد إضافية تصل إلى اثني عشر ضعف الاستثمار الأصلي. وعلى الرغم من أن الباحثين قد يكون لديهم إمكانية الوصول إلى ثروة من البيانات المشتركة، إلا أن الكثير ليسوا على بينة من موارد البيانات المتاحة. حتى لو كانوا يرغبون في إعادة استخدام مجموعات البيانات الحالية، قد يكون الباحثون غير متأكدين من كيفية تحديد موقعها والوصول إليها، والاستفادة منها لأبحاثهم. وهنا يمكن لأمناء المكتبات ذوي الخبرة في البحث عن موارد البيانات والإلمام بأنواع البيانات التي تحتوي عليها تلك الموارد أن يمثلوا فائدة كبيرة للباحثين الذين يواجهون صعوبة في تحديد مجموعات البيانات الموجودة. كما وهناك برامج خدمات البيانات التي تقدم الدعم والمساعدة في تحديد مجموعات البيانات، أينما تقتضي الحاجة، والوصول إلى البيانات المغلقة، وتقديم العون بشأن اتفاقات تقاسم البيانات، والمساعدة في تنظيم مجموعات البيانات وفقا لأفضل الممارسات، لأنه نادرا ما تأتي البيانات جاهزة للباحث لاستخدامها مباشرة، فقد يكون من الضروري الانتقال إلى تنسيق مختلف عندما يستخدم جامع البيانات الأصلي برامج ملكية خاصة. حتى البيانات في التنسيقات المفتوحة قد تحتاج إلى عمل على المتغيرات وإعادة تنظيم أو معالجة البيانات لنقلها وإعادة استخدامها.

  • التمثيل المرئي للبيانات

على الرغم من أنه ليس جزءا من عملية إدارة البيانات بشكل أساسي، فإن تمثيل البيانات هو مهارة مهمة للعمل بفعالية مع البيانات. وغالبا ما تستخدم التصورات لنقل نتائج البحوث النهائية وإظهار النتائج التي توصل إليها الباحث، ولكن تمثيل البيانات قد يكون أيضا وسيلة استكشافية لتحديد الأنماط بصريا والتي قد يكون من الصعب على خلاف ذلك أن تلاحظ في البيانات المعقدة. كما يمكن أن تكشف تصورات علاقات غير متوقعة في النظام، مثل الجينات أو البروتينات في عملية بيولوجية أو البشر في شبكة اجتماعية. يمكن للمرئيات الخاصة بالتسلسل الزمني أن تظهر تطور عملية معقدة مع مرور الوقت، مما قد يتيح فهم أفضل للعلاقات السببية والآثار المترابطة.

خرائط الحرارة في مجموعات البيانات المعقدة تجعل من الممكن أن نرى على الفور أنماط جديدة من خلال الاختلافات في اللون، بدلا من الغربلة خلال الآلاف من نقاط البيانات الرقمية الفردية. هذه ليست سوى عدد قليل من أنواع كثيرة من التصورات التي يمكن للباحثين توظيفها لتوضيح المعنى في بياناتهم وسهولة نقل هذا المعنى للآخرين. قد لا يبدو التصور او التمثيل المرئي للبيانات وكأنها عمل يتناسب وطبيعة عمل أمناء المكتبات، ولكن في الواقع، يمكن للمكتبات أن تكون مكانا منطقيا لوضع خدمات التصور المرئي للبيانات.

خدمات التصور في المكتبات هي في بعض النواحي مماثلة للميكرسبيسز “makerspaces” التي بدأت المكتبات في تقديمها، والتي توفر مساحة وأدوات للمستخدمين للاستكشاف والابتكار، باستخدام أدوات مثل الطابعات 3D وأدوات التصميم الرقمي. كما يمكن استخدام العديد من الأدوات افي مراحل أخرى من دورة حياة البيانات، مثل لغات البرمجة R وPython، لذلك أمناء المكتبات الذين يطورون الخبرة في هذه الأدوات قد يجدونه امتدادا طبيعيا لتقديم التمثيل المرئي للبيانات. وأخيرا، فإن العديد من أمناء المكتبات لديهم خبرة في أدوات التصور لأنهم يستخدمونها لتحليل وتصور البيانات المتعلقة بالمكتبة.

  • مشاركة البيانات

وكما بينت هذه المادة، فإن النظام الإيكولوجي للبحوث العلمية قد أكد بصورة متزايدة على أهمية تبادل البيانات البحثية. إن سياسات الممولين والمجلات التي تتطلب مشاركة البيانات جديدة بالنسبة لكثير من الباحثين، وقد يحتاج أولئك الذين لم يعتادوا على مشاركة بياناتهم إلى إرشادات في أفضل الممارسات للقيام بذلك. يمكن أن تكون احتياجات الباحثين بسيطة مثل تحديد مستودع مناسب لتخزين البيانات أو معقدة مثل إخفاء المعرفات الشخصية. إعداد البيانات لتقديمها إلى مستودع يمكن أن تكون مهمة تستغرق وقتا طويلا ومثيرة للحيرة؛ بعض المستودعات لديها متطلبات محددة جدا حول التنسيق والبيانات الوصفية.

في بعض الحالات، قد يرغب الباحثون في استضافة البيانات الخاصة بهم على موقع المختبر الخاص بهم أو في مكان آخر ملائم ويمكن الوصول إليه بشكل عام. من المهم أن يدرك الباحثون أهمية الالتزام المستمر بضبط الوصول إلى بياناتهم والحفاظ عليها. وبالإضافة إلى ذلك، ينبغي للباحثين النظر في كيفية أولئك الذين يعيدون استخدام البيانات والذين يرجعون إلى مجموعة البيانات. أصبحت معرفات الكائن الرقمي Digital object identifiers (DOIs) معيارا لاستشهاد البيانات. ولأنها دوما معرفات فريدة، فإن معرفات الكائن الرقمي لها مزايا أكثر من تحديد مواقع الموارد (URLs) المرتبطة عادة بمواقع الويب. تقوم مكتبة المعاهد الوطنية للصحة بتجربة خدمة التنقيب عن معرفات الكائن الرقمي للباحثين الذين يرغبون في الحصول على هذه لمجموعة البيانات الخاصة بهم (أو غيرها من الكائنات الرقمية ذات الصلة بالبحث، مثل البرمجيات أو التعليمات البرمجية). هذه الخدمة سوف تسمح للباحثين الحفاظ والتحكم في البيانات الخاصة بهم عن طريق الاستضافة الذاتية.

الفرص المستقبلية

حقق أمناء المكتبات في جميع أنحاء العالم نجاحا أوليا في تقديم الخدمات لدعم احتياجات الباحثين المتعلقة بالبيانات، ومن المرجح أن تزداد هذه الاحتياجات مع مرور الوقت. بالإضافة إلى أن طلب الممولون والمجلات بصورة متزايدة مشاركة البيانات وتقديم خطط إدارة البيانات؛ حتى لو أنه قد يتم أحيانا بشكل غير ثابت، فإن على الباحثين أن يتوقعوا أنه سيطلب منهم الامتثال لهذه السياسات في غضون السنوات القليلة القادمة. ونتيجة لهذه السياسات فمن المرجح أن یحتاج الباحثون إلی المساعدة في تعلم کیفیة الوصول إلی مجموعات البيانات ھذه والاستفادة منھا. لذا يمكن لأمناء المكتبات أن يلعبوا دورا مهما في مثل هذه البحوث، مما يجلب الخبرة في مجال إدارة المعلومات والمعارف. وبالنظر إلى أن العديد من المكتبات تواجه الآن تحديات خاصة بالتمويل، فلابد للمكتبات أن تثبت أهميتها المستمرة، هذا وكما أن توسيع نطاق الخدمات لتشمل إدارة البحوث والخدمات الأخرى لعلوم البيانات قد يكون وسيلة مفيدة لتقديم أنواع جديدة من الدعم لمجتمعات المستخدمين.