مدونة نسيج

تنظيم المعلومات في البيئة الرقمية باستخدام معيار دبلن لوصف المصادر الإلكترونية

Written by محمود مسروّة | 10/02/2013 09:12:44 ص

يشهد النشاط الببليوجرافي ومجال تنظيم المعلومات تحولات كبيرة ولعل أهمها طريقة التعامل مع المعلومات في البيئة الرقمية والتي تتطلب العديد من المهارات والقواعد والتقنينات، ما دفع إلى تطوير آليات ومعايير وقواعد تتناسب والشكل الجديد للمعلومة، سواء في شكلها أو انتاجها أو طريقة تخزينها وبثها. وهذا ما دفع بالمؤسسات المكتبية إلى أقلمة وتكييف نشاطاتها في البيئة الرقمية ومواجهة هذا الواقع بالآليات ومنهجية مناسبة من خلال تطبيق معايير وتقنينات من شأنها أن تساهم في التحكم وتنظيم المصادر الإلكترونية في البيئة الرقمية. ولعل أكثر المعايير التي لها علاقة مباشرة بمجال المعالجة الآلية للبيانات الببليوجرافية والذي كتب له الانتشار الواسع هو مبادرة معيار دبلنDublin Core Initiative المتبع في بناء وتنظيم المصادر الإلكترونية على الواب وفي مشاريع المكتبات الرقمية.

واقع تنظيم مصادر المعلومات على شبكة الواب

إن نظرة بسيطة على واقع ما ينشر يوميا على شبكة الإنترنت يدرك الإشكالية التي تواجهها المكتبات ومختلف مؤسسات المعلومات في مواجهة السيل العرم والتدفق الكبير للمعلومات؛ اقتناء وتخزينا ومعالجة، مما يجعل هذه المؤسسات في مواجهة تحديين كبيرين يتعلق الأول في القدرة على استيعاب ما يُنشر أما الثاني فيتمثل في كيفية تنظيمه لتسهيل الوصول إليه وإتاحته.

تبين عدة دراسات أمثال Dahn (2000) أن شبكة الإنترنت تحتوي على أكثر من 3 مليار مادة، فيها حوالي 1.4 مليار مكشفة يمكن الوصول إليها عن طريق محركات البحث وأكثر من 1.6 مليار مادة متاحة فقط؛ أي لا يمكن الوصول إليها عن طريق محركات البحث. كما أن دراسة Gomez (2005) حول الدوريات الإلكترونية واستخدامها تشير إلى أنه خلال 12 شهر ما يربو عن 44% من عناوين المواقع URL's غير صالحة للاستعمال؛ بحيث يقدر العمر الزمني لصحفة الواب على شبكة الأنترنت بـ 6 أسابيع فقط وأكثر من 40% من الموارد على شبكة الإنترنت غير مهيكلة من مجموع ما هو مكشف مما يصعب الوصول إليها من قبل محركات البحث. أما من الناحية الكمية فإن بعض الدراسات (بن لعلام، 2002) تشير إلى أن ما تم نشره خلال عقد من الزمن على شبكة الإنترنت يفوق أربعة أضعاف ما تم إنتاجه خلال عشر قرون. وبهذا تحولت الشبكة غداة ظهورها إلى مخزن معلوماتي رهيب، مما يطرح تساؤلات كثيرة وإشكالات عديدة تتعلق بطريقة وكيفية تعامل المكتبات مع ما ينشر على شبكة الإنترنت وكيفية الاستفادة منها، خاصة وأن الكثير من المصادر لا تنشر إلا على الصيغة الإلكترونية، وكذا السبل الكفيلة إلى تنظيم هذه المصادر المبعثرة وغير المهيكلة باستخدام معايير وتقنينات وقواعد من شأنها أن تساعد في التعامل مع المصادر الإلكترونية بطرق فهرستها والاحتفاظ بها وأرشفتها بصورة دائمة وهيكلتها وتنظيمها لتسهيل الوصول إليها وضمان استمرارية الوصول إليها مستقبلا.

والسؤال الذي يطرح نفسه بإلحاح في الوقت الراهن والذي يلقي بضلاله على مسألة تنظيم المعلومات ومسألة الضبط الببليوجرافي في البيئة الرقمية هو هل بالفعل يمكن تجاوز الضبط الببليوجرافي في البيئة الرقمية؟ وهل بإمكان محركات البحث المطورة أن تحل مشكلة التنظيم وهيكلة البيانات في البيئة الرقمية؟ فقد بينت دراسات عديدة أمثال Guy (2000) أن نسبة استرجاع المعلومات على شبكة الواب لا تتعدى 15%؛ أي بمعناه أن احتمال 85% من المصادر لا يمكننا إيجادها مرة أخرى على الرغم من التطور الكبير الذي تشهده التقنية مما يشير إلى مدى الفوضى التي تتسم بها عملية النشر وتنظيم مختلف المصادر المعلوماتية على الواب. وهذا ما دفع بالمختصين في منتصف عقد التسعينات إلى التفكير في طريقة لهيكلة المصادر الإلكترونية على شبكة الإنترنت وفي المكتبات الإلكترونية لتسهيل الوصول إليها، وقد كان تطوير ما أصبح يسمى فيما بعد بما وراء البيانات (الميتاداتا) إحدى أهم تلك الوسائل والآليات وهي بهذا الرجوع إلى الطريقة التقليدية للفهرسة المعتمدة في المكتبات منذ مئات السنين.

المكونات الأساسية للبيئة الرقمية

يرى تيليي (Tellier, 1993) أن المكونات الأساسية التي يجب توفرها في البيئة الرقمية هي:

  • المعلومة على الشكل الرقمي؛
  • التكنولوجيات الحديثة لنقل المعلومات والاتصال؛
  • الوسائل التقنية المستعملة من قبل المستعمل للوصول إلى المعلومة.

ويمكن تمثيل هذه المكونات وفق مجموعة من العناصر والمتمثلة في:

1) البيانات (على الشكل الإلكتروني فقط)، وهي المصادر المعلوماتية المختلفة،

2) ماوراء البيانات، والتي تشمل كل أدوات الوصول إلى المعلومات وتتمثل في فهارس المكتبات الرقمية وخطط التصنيف، وفي الأخير،

3) الخدمات، والمتمثلة في الإتاحة الكاملة وتسهيل الوصول الكامل إلى مختلف المصادر والاستفسار عنها.

الميتاداتا والضبط الببليوجرافي في البيئة الرقمية

الميتادا أو ما وراء البيانات كما تعرفها الموسوعة العربية لمصطلحات علوم المكتبات والمعلومات هي "بيانات عن البيانات" وقد فهمت على أنها توسعة لممارسات الفهرسة الببليوجرافية التقليدية ليشمل البيئة الرقمية. أما المعنى الإصطلاحي للكلمة فإنها تحيل إلى ما وراء البيانات أو البيانات عن البيانات وهو نفس المفهوم الذي يُستخدم عادة في النشاط الببليوجرافي في المكتبات والتي تُستخدم لوصف مصادر المعلومات التي تضعها المكتبات على فهارسها، ولكنها اختصت بوصف نوع معين من المصادر وهي المصادر الإلكترونية على شبكة الإنترنت، والتي تعطى لإحدى المجموعات التالية:

  • الوصف لتسهيل وإيجاد المصادر.
  • الإدارة لتدعيم إدارة المصادر ضمن مجموعاتها.
  • الهيكلة لبناء مركبات لمواد معلوماتية معقدة.

لمحة تاريخية عن استخدام مصطلح ما وراء البيانات

يستخدم هذا المصلح بأشكال متعددة لدى فئات تخصصية مختلفة في ميادين شتى. تاريخيا، لا تعتبر فكرة ما وراء البيانات جديدة في الأوساط المكتبية باعتيار أن مختلف المعايير وقواعد الوصف معروفة منذ أزيد من قرنين؛ حيث ترجع أول محاولات التقنين في الميدان الببليوجرافي إلى منتصف القرن التاسع عشر وبالضبط إلى سنة 1839 مع القواعد المطورة مع Pannizi ثم معJewett سنة 1853 ثم معCutter سنة 1876. فقواعد الفهرسة على مختلف أنواعها هي شكل من أشكال ما وراء البيانات تهدف إلى وصف مصادر المعلومات، وقد تم توظيفها في وصف المصادر الإلكترونية نتيجة التحول الكبير الذي شهدته المعلومات والشكل التنظيمي الجديد الذي تحولت إليه المكتبات اليوم.

وظيفة ماوراء البيانات/الميتاداتا

تتمثل الوظيفة الأساسية لما وراء البيانات، كما يذكر العريشي (2005)، فيما يلي:

  • تحديد وتعريف المصادر الإلكترونية لتسهيل الوصول إليها وإتاحتها؛
  • تنظيم المصادر الإلكترونية حسب معايير مختلفة كالجمهور أو الموضوعات من خلال بنائها كصفحات على شبكة الواب؛
  • القابلية للتشغيل المتبادل للبيانات بين الأنظمة المتعددة مع أجهزة الحاسب الآلي وبرامجها؛
  • الوصف الرقمي للمصادر للتفريق بين نفس المصادر، خاصة إذا تعرضت للتغيير أو للتعديل.
  • الحفظ والأرشفة الدائمة للمصادر الإلكترونية لاسترجاعها مستقبلا وضمان ديمومتها.

وتعمل حاليا مجموعة من المنظمات والمكتبات على المستوى العالمي على تطوير مشاريع ما وراء البيانات على غرار ما قامت به كل من مجموعة مكتبات البحث RLG بالتعاون مع مركز الحاسب الآلي على الخط المباشر OCLC بتطوير مجموعة من الاستراتيجيات للترميز والتخزين وإدارة حفظ ما وراء البيانات ضمن نظام حفظ رقمي يتوافق مع مجهودات منظمة التقنين العالمية الأيزو ISO لما يعرف بالنمودج المرجعي لنظام المعلومات الأرشيف المفتوح (ISO Reference Model for an Open Archival Information OAIS). ولعل أهم معيار عرف انتشارا واسعا في مجال تنظيم المصادر الرقمية على شبكة الواب وفي المكتبات الرقمية هي مبادرة معيار دبلن لوصف المصادر الرقمية.

مبادرة معيار دبلن

تعود تسمية المعيار إلى المدينة التي نشأ فيها وهي مدينة دبلن بولاية أهايو في الولايات المتحدة الأمريكية إثر مناقشات جرت عام 1995 في ورش عمل برعاية مركز الحاسب الآلي للمكتبات على الخط المباشر OCLC والمركز الوطني للتطبيقات الحاسوبية المتطورة NCSA. يتكون المعيار من 15 عنصر إبتداءً من 1997 وهي عناصر اختيارية ومتكررة، بسيطة ولكنها فعالة، هدفها وصف مجموعة معتبرة ومنوعة من المصادر الإلكترونية. لقد تم الاتفاق عل دلالتها بإجماع عالمي من قبل المختصين في اختصاصات مختلفة في الحاسب الآلي والمكتبات والمعلومات والمتاحف والأرشيف وتخصصات أخرى ذات العلاقة، من أكثر من 10 دول. وفي 4 نوفمبر سنة 1998 تم تنظيم الورشات السادسة لمعيار تركيبة دبلن حضرها أكثر من 100 مختص من أكثر من 16 دولة من أربع قارات، وقد طرحت في اللقاء إشكالات عديدة متعلقة بالمجالات التطبيقية للتركيبة وعلاقتها بالمعايير الأخرى ذات العلاقة وقد كانت هذه الورشات بمثابة الأرضية التي سمحت بطوير المعيار في السنوات اللاحقة.

خصائص وأهداف المعيار

تتميز هذه التركيبة بمجموعة من الخصائص لعل أهمها:

  • تسهيل إنشاء وإدارة الوثائق والمصادر الاكترونية، نظرا لبساطة عناصره المكونة؛
  • عناصر ذو دلالات بسيطة ومفهومة لدى الجميع، حيث تم اعتماد كلمات معروفة عالميا وهذا من شأنه أن يساعد الباحث المبتدأ والمحترف.
  • ذو بعد عالمي، حيث عرفت المبادرة ترجمات عديدة (أكثر من 20 لغة) منها العربية؛
  • التوسعة، وذلك لموازنتة بين بساطة العناصر المستعملة لوصف المصادر الإلكترونية وبين دقتها، كما يتوسع ليشمل احتياجات متعددة من مجالات واختصاصات مختلفة.

مكونات معيار دبلن

يتكون معيار تركيبة دبلن من مجموعة من الحقول التي تُستخدم لوصف المصادر الإلكترونية المعينة، بحيث يمكن تقسيم هذه العناصر إلى ثلاث مجموعات رئيسية، كما يبينها الجدول رقم (01).

ومجموع هذه العناصر يمكنها بدورها أن تنقسم إلى مجموعة صغيرة أكثر تفصيلا وهذا باستعمال مجموعة من المعرفات والمحددات التي تميز مجموعة العناصر الصغرى من المجموعة الكبيرة. مثال ذلك مجموعة التغطية التي ينظر إليها من منظور زمني أو جغرافي. تنقسم المعرفات إلى مجموعتين رئيسيتين تدعى الأولى محددات العناصر والتي تسمح بتحديد معنى العناصر لتكون أكثر دقة، (مصطلح أضيق بالنسبة للعنصر غير المعرف).

الجدول رقم (01): حقول الوصف لمعيار دبلن

المضمون (المحتوى)

مسئولية الملكية الفكرية

الوصف المادي

العنوان/ Title

المنشأ/Creator

التاريخ/Date

المحتوى/ Subject Description

الناشر/ Publisher

النوع/ Type

المصدر/ Source

المؤلف المساعد/Contributor

الشكل المتاح/Format

اللغة/Language

الحقوق/ Rights

المحدد/ Identifier

العلاقة/Relation

التغطية/Coverage

أما الثانية فإنها تتضمن مخطط التشفير والذي يسمح بتحديد المخططات التي تساعد على فهم وترجمة قيمة عنصر معين، مثل التصنيف والمكانز وقوائم رؤوس الموضوعات، إلخ.

خاتمة

لقد أصبحت مسألة تنظيم الواب ومختلف المصادر الإلكترونية على شبكة الإنترنت من القضايا التي شغلت المتخصصين والناشرين والمستخدمين في ظل الانفجار الرهيب للمصادر الإلكترونية وتوسع النشر الإلكتروني، مما استوجب ضرورة إيجاد قواعد ومعايير من شأنها أن تساعد في هيكلة هذه المصادر، الأمر الذي كان دافعا رئيسيا لتطوير قواعد ومعايير من شأنها أن تساعد في وصف وهيكلة وتنظيم مختلف المصادر الإلكترونية وقد توصلوا إلى تطوير ما وراء البيانات أو ما يعرف بالميتاداتا.

ولعل معيار دبلن الذي طُور في منتصف التسعينات من بين أهم المعايير التي لقيت رواجا كبيرا في الميدان الببليوجرافي ولدى فئة المكتبيين وأخصائيي المعلومات في مجال تنظيم المعلومات في البيئة الرقمية نظرا لقربها من قواعد الفهرسة التقليدية. فكما أن هذا المعيار أخذ مكانة كبيرة على المعايير الآلية التقليدية، كصيغة مارك مثلا، على الرغم من التطور الذي صاحب تلك التركيبات لاستيعاب هيكلية المصادر الإلكترونية.

إن اعتماد وتطبيق هذه المعايير على مجال واسع يدل على التوجه بالرجوع إلى الطريقة التقليدية التي استخدمتها المكتبات في تنظيم مختلف المصار والأوعية المطبوعة ولعل حجم المشاريع الببليوجرافية العالمية دليل على هذا التوجه، مما يستوجب ضرورة سعي المكتبات والمؤسسات الوثائقية في العالم العربي إلى ضرورة أخذ هذا المنحى وتطبيقه في تنظيم وهيكلة المصادر الإلكترونية والرقمية في المشاريع العربية التي بدأت تظهر في الأونة الأخيرة على مستويات مختلفة على غرار مشروع الفهرس العربي الموحد الذي سيكون لبنة للمكتبة الرقمية العربية إضافة إلى مشاريع عديدة منها المكتبة الرقمية العربية لمكتبة الملك عبد العزيز العامة ومبادرة الملك عبد الله للمحتوى الرقمي إلى غير ذلك من المشاريع المماثلة في العالم العربي على الرغم من قلتها.

المراجع

  1. 1. بن لعلام، رياض (2002). تحولات العمل التوثيقي في مجتمع المعلومات: التحديات وأدوات العمل الجديدة بالنسبة للمكتبات الجامعية الجزائرية. في: مجلة المعلومات العلمية والتقنية، مج 11، ع 1 ، 2002. ص ص 5-22.
  2. 2. العريشي، جبريل بن الحسن (2005). فهم ما وراء البيانات (الميتاداتا)؛ ترجمة. ط 1، (سلسلة المعلوماتية ؛ 2)، 2005 47 ص.
  3. 3. الشامي، أحمد محمد وسيد حسب الله (2001). الموسوعة العربية لمصطلحات علوم المكتبات والمعلومات والحاسبات: انجليزي- عربي. القاهرة : المكتبة العربية، 3 مج.
    1. DAHN, Michael (2000). Counting Angels on a Pinhead: Critically Interpreting Web Size Estimates. Online, Jan. /Feb. 2000. Pp. 35-40.
    2. GOMEZ, de Regil & ROSA, Maria (2005). Métadonnées pour les ressources d'enseignement et formation : journée d'information AFNOR CG 46. "Des metadonnées pour bien utiliser les ressources électroniques. BNF- 7 juin 2005.
    3. GUY, Teasdale (2000). De la nécessite des metadonnées sur Internet et les Intranets. La Lettre du bibliothécaire québécois. No. 21, Jan.-mar. 2000. Available at: http://www.sciencepresse.qc.ca/lbq/lbq21.html
    4. TELLIER, Sylvie (1993). La bibliothèque virtuelle: l’information au bout des doigts. Direction informatique, 14 Nov. 1993, vol. 6, n.1, p. 14.
    5. إعداد - محمود مسروة