مدونة نسيج

التعشيش البولينى: تأملات وتساؤلات في مدى جدوى استخدام معاملات البحث

Written by هيام حايك | 25/07/2014 09:34:29 م

في الجامعة وتحديدا في أقسام المكتبات يتعرف الطلاب على مفهوم التعشيش البولينى, والتعشيش (Nesting) هو استخدام أكثر من أداة وعلامة بحث وذلك باستخدام معاملات البحث مثل AND - OR - NOT وكذلك الأقواس ومن المؤكد أن الطلبة يتعلمون استراتيجية البحث والتي عادة ما تتخذ الشكل التالي:

  • التفكير في موضوع البحث
  • تفكيكه إلى مفاهيم رئيسية, وعادة ما تكون ثلاثة أو أكثر قليلا, على سبيل المثال: A , B , C
  • تحديد المرادفات لكل مفهوم, فيصبح لدينا على سبيل المثال:

(A1, A2, A3; B1 ,B2 ,B3; C1, C2, C3)

  • الجمع بينهما على النحو التالي:

(A1 OR A2 OR A3) AND (B1 OR B2 OR B3) AND (C1 OR C2 OR C3)

[youtube https://www.youtube.com/watch?v=TKLB6D06sKs&w=560&h=315]

كما أن الأكاديميين الذين درسوا موضوع محو الأمية المعلوماتية، لابد أنهم درسوا ذلك في فصولهم. وربما أرادوا مزيدا من الحيوية باستخدام الأدوات الأخرى مثل wildcards والتي تعمل باستخدام رمز معين وسط كلمة البحث للوصول إلى عدد كبير من الكلمات المتشابهة ومختلفة في التهجئة.

قواعد البيانات أيضا تشجع هذا النمط البحثي. ولكن هل هذه الأنماط من البحث ضرورية حقا أو مفيدة؟

الكثير منا قد يستخدم هذه الأنماط من البحث دون أن يفكر فيها كثيرا, والأكثر يعتادون استخدامها ويمارسونها بصورة آلية، فهم يشعرون بأنها منطقية جدا ومتناغمة جدا, ولكن, دعونا نرجع بالذاكرة قليلا, أغمض عيناي لأتذكر متى كانت آخر مرة استخدمت فيها هذه الأدوات؟ لقد كان ذلك منذ سنتين أثناء القائي لمحاضرة حول البحث في جوجل كنوع من التعريف بها! وها أنا ذا أقضي العديد من الساعات يوميا على الإنترنت في البحث عن المعلومات ولم أفكر بالفعل في استخدامها! وأجذم أن الكثير من القراء على شاكلتي. ذلك يجعلنا نتساءل في نطاق ونجاعة استخدام هذه الأدوات للبحث في الخدمات المعلوماتية المتواجدة بوفرة على شبكة الإنترنت.

وأنا هنا لا أتشدد وأذهب باتجاه التخلي عن مثل هذه الأنماط كلياً, ولكن لابد من توخي الحذر في استخدامها, حيث من الممكن أن لا يؤدى هذا النمط من البحث على نحو متزايد إلى تحسين نتائج البحث, بل من الممكن أن يعود بالضرر.

ذلك لأن العديد من محركات البحث، والتي نستخدمها على نحو متزايد لم تعد مهيأة لهذا النوع من البحث على الرغم من أنها كانت تستخدم في الماضي.

امتازت أدوات بحثنا في الماضي بما يلي:

  1. البيانات الوصفية Metadata (بما في ذلك مصطلحات الموضوع) + المستخلص فقط - لم يكن هناك النص الكامل.
  2. البحث الدقيق Precise searching - ما تقوم بإدخاله هو ما تحصل عليه في نتائج البحث.
  3. انخفاض مستويات التجميع low levels of aggregation – قواعد بيانات كبيرة, والتي قد تصل إلى مليون مادة إذا كنت محظوظا.

في مثل هذه الظروف، كان لمعظم عمليات البحث التي كنت تجريها عدد قليل جدا من النتائج. ولو كنت سيئ الحظ ستكون النتيجة صفر. لماذا؟

أولا, لأن البحث يُجَارِي فقط البيانات الوصفية والمستخلص فقط وليس النص الكامل. لذلك إذا كنت تبحث عن " Youth " وقد حدث أن المؤلف قرر أن يستخدم كلمة " Teenager "، في العنوان والمستخلص, فأنت هنا تكون قد غرقت. كما أن هذا يضاعف من حقيقة أنه في تلك الأيام، كانت عمليات البحث أيضا تستدعى الدقة العالية, حيث لم يكن هناك تقنية التجذير الآلي autostemming والتي تقوم بإرجاع الكلمات تلقائيا الى جذر وحيد مماثل وتغطي الكلمات المتباينة (بما في ذلك التهجئة الأمريكية مقابل البريطانية) ، لذلك كان عليك أن تكون حذرا لتشمل جميع المتغيرات مثل صِيغ الجمع، وغيرها من الأشكال الأخرى ذات الصلة.

ثانياً, في تلك الأيام كانت قواعد المعلومات مجزأة وأصغر بكثير, كما كانت الفهارس صغيرة للغاية مقارنة بالحالية؛ لذا من الصعب أن نتصور اليوم وفي وجود الباحث العلمي من Google والذي يشتمل على ما يقارب من 100 مليار وثيقة (وأنظمة البحث التجميعي Web Scale discovery systems التي تقاربه في العدد) أن تكون النتيجة صفراً أو في أحسن الأحوال بضع عشرات من النتائج. هذا هو السبب في أن تقنية التعشيش البولينى (A1 OR A2 OR A3) AND (B1 OR B2 OR B3) AND (C1 OR C2 OR C3) تقنية حساسة عند استخدامها لتوسيع البحث الدقيق للغاية لزيادة الاستدعاء.

تغييرات في بيئة البحث:

لقد تغيرت بيئة البحث اليوم, فقواعد بيانات النص الكامل هي الأكثر شيوعا. في الواقع، بالنسبة لكثير من المستخدمين وأمناء المكتبات الأصغر سنا، "قواعد البيانات" تعني ضمنا قواعد بيانات النص الكامل ومن الممكن أن تفزعهم فكرة أنه كان يتم استخدام الفهرسة والمستخلص للبحث في قواعد البيانات بدلا من الحصول على الإشباع الفوري من عنصر النص الكامل.

كما أن تقنية البحث في النص الكامل بدلا من الميتاداتا metadata فقط غيرت الكثير. فإذا كان هناك مقال عن المراهقين (TEENAGER ) ، فهناك احتمالات كبيرة لأن تجد TEENAGER وربما TEENAGER و ADOLESCENCE و, YOUTH وغيرها في النص الكامل للكتاب أو المادة ، لذلك ربما كنت لا تحتاج إلى إضافة هذه المترادفات للحصول عليها في النتيجة على أي حال. علاوة على ذلك، قواعد البيانات على نحو متزايد وتحت تأثير جوجل بدأت تكون أكثر "فائدة"، من خلال التجذير الآلي autostemming وإضافة المرادفات والكلمات المتقاربة.

أنا لن أقول هذه الأنواع من عمليات البحث هي دائما غير مجدية في جميع الحالات، ولكن ما أود قوله أنها في كثير من الأحيان لا تساعد ولا سيما في حالات مثل البحث في Google، و Google Scholar، وأنظمة البحث التجميعي على شبكة الإنترنت.

البحث الدقيق باستخدام العوامل المنطقية لها استخداماتها الفعالة في محركات البحث الصحيحة و قاعدة البيانات الصحيحة, مثال محرك البحث PubMed والذي يعمل بفاعلية في قاعدة البيانات MEDLINE وهي عبارة عن قاعدة بيانات ببليوغرافية تنتجها المكتبة الوطنية للطب ( NLM -USA ). أهم ما يميز البحث بواسطة PubMed هو استعماله للمكنز و لائحة المصطلحات الطبية MeSH : Medical Subject Headings و التي تعتبر من أهم المكنزات الطبية و التي تحوي مصطلحات متنوعة تعبر بشكل ما عن أهم المجالات الطبية و لكن بشكل غير دقيق يتناسب مع البحث في قاعدة بيانات بيليوغرافية. عملية الفهرسة في PubMed تربط بين الإصدار من MEDLINE و أكثر المصطلحات من MeSH التي تعبر بدقة عن الإصدارات. حقيقة أن البحث الطبي يعتمد على مراجعات منهجية خاصة يتطلب الشمولية والسيطرة هو عامل آخر يجب أخذه بعين الاعتبار. من هنا تزيد احتمالية أهمية استخدام أدوات البحث البولينى للتمكن من استعمال الكلمات المناسبة للبحث بطريقة دقيقة.

وأعتقد أيضا إذا كنت تريد أن تُفعل مثل هذا البحث، يجب أن نفكر بجدية عند إضافة أكثر من مرة OR أو استخدام wildcards. فمع خدمات البحث على شبكة الإنترنت في النص الكامل، والتجذير الآلي، يؤدي الاختيار السيء للأداة مع وجود العديد من الكلمات المفتاحية إلى انفجار عمليات البحث وإيراد نتائج قد لا تكون ضمن ما كنت تتوقع. فالاستخدام الاستراتيجي لكلمات البحث الرئيسية هو المفتاح هنا.

وفي النهاية أود أن أنوه إلى أن هذا الطرح مستوحى من فكرة يناقشها Aaron Tayأمين المكتبة في جامعة سنغافورة الوطنية, والذي دفعني إلى التفكير بالفعل في مدى جدوى استخدام معاملات البحث التي ندرسها لطلابنا ومن نخدمهم في مكتباتنا, وأهمية الحذر في الاستخدام المتزايد لها.

إعداد: هيـام حـايك- كاتبة بمدونة نسيــج

المصدر:https://www.libraries.psu.edu/psul/cathelps/adv_search_opt.html