أصبح البحث خيطًا مشتركًا في حياتنا اليومية. فقد أصبح جوجل وغيره من محركات البحث المرجع الأول للبحث عن المعلومات. ابتداءً من المعلومات المطلوبة لإنهاء جدل عالق حول موضوع ما، أو معلومات مطلوبة لحل مشكلة علمية أو حياتية، أو أي شي آخر تريد معرفته. المهم في الموضوع أن جوجل هو الوجهة الأولى للبحث، لدرجة ان معظم الناس لا تفكر حتى في اختيار محرك بحث آخر لاستخدامه، لأنهم وببساطة لا يعرفون إلا “جوجل“. ولكن الأمر مختلف بالنسبة لأمناء المكتبات ( انهم أخصائيو المعلومات ) والذين لا يولون أهمية كبرى لموضوع البحث عن المعلومات فحسب ، ولكنهم يهتمون بتقديم المعلومة الصحيحة في الوقت المناسب وللشخص المناسب, يطورون استراتيجيات البحث الشاملة المطلوبة لإجراء مراجعات منهجية، حيث أن تعلم الأساليب الأساسية والمتقدمة للبحث عن أنواع مختلفة من المعلومات، وتقييم نتائج البحث، واستكشاف طرق استرداد المعلومات الشخصية Personalized Information Retrieval (PIR) باستخدام العلامات التعاونية، والمعروفة باسم folksonomies، وفهم كيفية تشكيل الخوارزميات لاستعلاماتنا ليست سوى عدد قليل من الأشياء التي يستكشفونها خلال البرنامج الدراسي وخلال الممارسة العملية.
التنظيم والاسترجاع التشاركي للمعلومات
شجعت التطورات الحاصلة في بيئة الويب 2,0 والتي أسهمت بشكل كبير في وجود الكم الهائل من المعلومات عبر شبكة الانترنت وعدم القدرة على السيطرة عليها بالأساليب والأدوات التقليدية، الي التفكير في إيجاد نظاماً يسمح لمشاركة الجميع في عملية وصف المعلومات المتاحة بما يسهل من عملية تنظيمها وتسهيل الوصول إليهاـ وبدأنا بالفعل نشهد فهرسة المعلومات باستخدام "الذكاء الجماعي".
ينشأ "الذكاء الجماعي" من الجهود المشتركة لمجموعة من المؤلفين أو المستخدمين و يسمى "الخدمات التعاونية". يمكن تلخيص هذه الخدمات تحت العلامة. أنها توفر إمكانيات لحفظ أو البحث في اليوميات (Weblogs ، Technorati) ،و لبناء الموسوعات (Wikipedia) وإدارة الإشارات المرجعية (Del.icio.us) ، والصور (Flickr) أو مقاطع الفيديو (YouTube). في بعض الأحيان يتم الجمع بين العديد من الخدمات التكميلية وبناء "عمليات دمج" جديدةـ فالتعاون لا يقتصر على توفير المحتوى ولكنه يشمل أيضًا فهرسة المعرفة المقدمة في بعض خدمات Web 2.0.
تعتمد Folksonomies، التي تعد في الأساس فهارس للمواد عبر الإنترنت، على مبدأ الويب 2.0 للذكاء الجماعي، لأنها طريقة لفهرسة المعرفة الموزعة. إنها طريقة رائعة لتتبع مسارات البيانات عبر الإنترنت والموارد المفيدة التي تم اكتشافها. على الرغم من أنه يمكن إنشاء الفلوكسانومي بشكل فردي، إلا أنه من الممكن أيضًا لمجموعات من الأشخاص - سواء أكانوا معلمين أو باحثين أو طلاب - إنشاء مجموعات من الموارد بشكل تعاوني حول موضوعات معينة ، مع مناقشة معايير الإدماج من قبل أعضاء المجموعة.
تعرف ويكيبيديا الموسوعة الحرة الفولكسونومي (Folksonomy) بأنه ترتيب محتويات موقع بطريقة تعاونية بين المستخدمين باستخدام كلمات تُربط بكل محتوى بغرض وصفه، وتُعرف هذه الكلمات بالبيانات الوصفية أو الكلمات المفتاحية وبحيث يستطيع أي مستخدم كتابة وصف لمحتوى – مثل صورة أو مقال- بكلمة أو بمجموعة من الكلمات
تُستخدم Folksonomies على مواقع التواصل الاجتماعي مثل Flickr وTwitter وInstagram لمساعدة المستخدمين في البحث عن مواضيع تهمهم، ولجعل المحتوى الخاص بهم أكثر قابلية للبحث والوصول إلى جمهور. وهذا يجعلنا نتساءل، هل نماذج التوصية PIR هي مستقبل كتالوجات المكتبات من الجيل التالي؟
كيف تعمل طرق استرداد المعلومات الشخصية؟
يهدف إضفاء الطابع الشخصي على استرجاع المعلومات (PIR) إلى تخصيص بحث موجه للمستخدمين من خلال مراعاة المعلومات الإضافية حول المستخدمين بالإضافة إلى استفساراتهم.
تعتمد أنظمة فولكسونومي على ثلاث متغيرات أساسية: المستخدمون والموارد والعلامات tagging. تشكل هذه المتغيرات الثلاثة الأساس لحساب وزن العلامات وترتيبها في أنظمة وضع العلامات المختلفة. تستخدم نماذج PIR ملفات تعريف المستخدمين وملفات تعريف الموارد لتخصيص تجربة البحث الخاصة بهم بناءً على اهتماماتهم بهدف تحديد أقرب إجابة لاحتياجات الشخص بناءً على خصائص حساب المستخدم الخاص به.
يتضمن جزء كبير من نماذج PIR على أنظمة التوصية. هناك الكثير من الأبحاث حول طرق PIR المختلفة التي قد تغير بشكل جذري كيفية ترتيب المستندات والعلامات الموصى بها للمستخدمين. تقر بعض أنظمة توصيات PIR بأن سلوكيات وضع العلامات لدى المستخدمين غالبًا ما تتغير بمرور الوقت، لذلك يجب أن يأخذ النظام المثالي في الاعتبار سلوك وضع العلامات التاريخي للمستخدم عند تقييم وزن وترتيب المورد الذي تم وضع علامة عليه. تستكشف الخوارزميات العلاقة بين ملاءمة الاستعلام واهتمامات المستخدم.
يعتبر تحليل المشاعر باستخدام تقنيات الذكاء الاصطناعي وتعلم الآلة هو وسيلة لاستكشاف اهتمامات المستخدمين ومشاعرهم بناءً على الموضوعات التي يتابعونها والعلامات التي بحثوا عنها في الماضي. يطبق تقييمات التشابه لإنشاء دقة أعلى للموارد المستردة. تنشئ الخوارزميات علاقات بين الكلمات والجمل، وتصنف العلاقات الدلالية بين الجمل والعبارات. يتم تصنيف المصطلحات باستخدام نماذج من العلاقات الخطية، ويكون لمن حصلوا على أعلى الدرجات وزن أكبر في تمثيل موضوع ما.
أنظمة التوصية وآلية عمل الخوارزميات
تقدم دراسات طرق استرداد المعلومات الشخصية PIR بعض الأفكار حول كيفية ترتيب الخوارزميات ووزن الناس وكيفية استخدام الشركات الخاصة لأساليب مماثلة عند اقتراح الموارد للمستخدمين. عندما أفكر في نماذج PIR المستخدمة مع الناس. يتبادر إلى الذهن Twitter، فعندما تتفاعل مع مستخدم آخر أو علامة تصنيف معينة، فإن الخوارزمية تضيف مستخدمين وعلامات تصنيف مماثلة إلى خلاصتك. وفي هذا السياق تكون الخوارزمية عبارة عن مجموعة رياضية من القواعد تحدد كيف تتصرف مجموعة من المعلومات.
في وسائل التواصل الاجتماعي، تساعد الخوارزميات في الحفاظ على كل شيء تحت السيطرة، وتساعد في ترتيب نتائج البحث والإعلانات. وهنا نتحدث Twitter لأنه ظهر في الأخبار مؤخرًا تصريح Elon Musk في حديث TED حديثًا عن نواياه في جعل Twitter مفتوح المصدر، وذلك لتعزيز شفافية الخوارزمية، والتي ستكون فرصة للتحليل النقدي لخوارزميات منصة التواصل الاجتماعي وإجراء مزيد من الأبحاث حول أنظمة PIR، ورؤية المزيد من الدراسات حول كيفية تشكيل أنظمة PIR لتجارب المستخدمين. كما أنه يفتح مزيدًا من البحث حول الآثار الأخلاقية لأنظمة PIR والحلول الممكنة.
قد تبدو الخوارزميات مفيدة وغير ضارة في الغالب بالنسبة إلى العملاء الاجتماعيين العاديين، مما يساعد على تصفية المحتوى وتقديم محتوى "ذي صلة" فقط بدلاً من المشاركات العشوائية. ومع ذلك، فإن المسوقين الذين لا يدركون ماهية الخوارزميات أو كيفية عملها سيجدون أنفسهم يواجهون صراعًا مستمرًا.
ما هي خوارزميات الوسائط الاجتماعية؟
تعتمد خوارزميات الوسائط الاجتماعية طريقة لفرز المشاركات في خلاصة المستخدمين بناءً على مدى ملاءمتها، وليس بناءً على وقت النشر. تعطي الشبكات الاجتماعية الأولوية للمحتوى الذي يراه المستخدم في خلاصته أولاً من خلال احتمالية رغبته في مشاهدته.
بشكل افتراضي، تأخذ خوارزميات الوسائط الاجتماعية زمام تحديد المحتوى الذي سيتم تقديمه لك بناءً على سلوكك. على سبيل المثال، قد يضع Facebook أو Twitter منشورات من أقرب أصدقائك وعائلتك في المقدمة والوسط في خلاصتك لأن هذه هي الحسابات التي تتفاعل معها كثيرًا. من المحتمل أن تكون قد تمت التوصية لك بمشاهدة مقاطع فيديو على YouTube، وهذا يعتمد على سلوكك الفردي، والبحث فيما شاهدته في الماضي وما يشاهده المستخدمون الذين يمتلكون سمات مشابهة لك. من ناحية أخرى يعتبر التصنيف وعلامة الهاشتاق (هاشتاج) والكلمات الرئيسية عوامل مؤثرة على المحتوى الموصى به على أي شبكة معينة.
كيف تعمل أنظمة التوصية في المكتبات
عندما يكون عدد الكتب التي توفرها المكتبة كبيرًا نسبيًا، يصبح من الصعب على المستخدم اختيار الكتاب المناسب من بين الكثير من الكتب التي تتزايد أعدادها سنوياً، والذي ينعكس على حاجة المستخدمون إلى قضاء الكثير من الوقت في اختيار كتاب يرغبون في استعارته او الاطلاع عليه. في الوقت نفسه، لا يتم استخدام العديد من الكتب بشكل فعال، مما يؤدي إلى إهدار موارد المكتبة. هذه الظواهر ناتجة عن "التحميل الزائد للمعلومات". لحل هذه المشكلة، تحتاج المكتبة إلى الاعتماد على آلية لتصفية المعلومات. تنقسم آلية تصفية المعلومات إلى نوعين من الأنظمة، هما نظام البحث ونظام التوصية. يعمل نظام البحث على استخدام الكلمات الرئيسية لمساعدة المستخدمين في العثور بسرعة على الكتب ذات الصلة؛ بينما يقوم نظام التوصية تلقائيًا بالتوصية بالكتب للمستخدمين.
تسعى أنظمة التوصية الشخصية Personalized recommender system إلى توقع التفضيل بناءً على اهتمامات المستخدم وسلوكه ومعلومات أخرى. التوصية المخصصة لا تقوم بتوفير احتياجات المستخدم فحسب، ولكن أيضًا تساعد المستخدمين على استكشاف واكتشاف اهتمامات جديدة. إن تطبيق أنظمة التوصية في مكتبة الجامعة يحل مشكلة صعوبة اختيار الكتب، ويحسن معدل استخدام موارد المكتبة.
يتم استخدام أنظمة التوصية في مجموعة متنوعة من المجالات: تتضمن بعض التطبيقات الشائعة الأفلام والكتب والمقالات البحثية والعلامات الاجتماعية. هناك ثلاث فئات أساسية من خوارزميات التوصية:
التصفية التعاونية: تعتمد طرق التصفية التعاونية على جمع وتحليل كمية كبيرة من المعلومات حول سلوكيات المستخدمين أو أنشطتهم أو تفضيلاتهم والتنبؤ بما سيحبه المستخدمون بناءً على تشابههم مع المستخدمين الآخرين.
التصفية القائمة على المحتوى: تعتمد طرق التصفية المستندة إلى المحتوى على وصف العنصر وملف تعريف تفضيل المستخدم. تحاول هذه الخوارزميات التوصية بعناصر مشابهة لتلك التي أحبها المستخدم في الماضي.
التوصية الهجينة: تجمع التوصية الهجينة بين التصفية التعاونية والتصفية القائمة على المحتوى. يمكن أن تكون الأساليب الهجينة أكثر فعالية في بعض الحالات. يمكن أيضًا استخدام هذه الطرق للتغلب على بعض المشكلات الشائعة في أنظمة التوصية مثل مشكلة التباين.
استراتيجيات التوصية الهجينة
التوصية الهجينة لديها ثلاث استراتيجيات. الأول هو إجراء تصفية تعاونية تعتمد على المحتوى بشكل منفصل ومن ثم دمجها. والثاني هو إضافة القدرات القائمة على المحتوى إلى نهج التصفية التعاوني (والعكس بالعكس)، والثالث عن طريق توحيد الأساليب في نموذج واحد.
خوارزمية التصفية التعاونية على أساس مستخدمي الجامعة: تنقسم خوارزمية التصفية التعاونية القائمة على المستخدم إلى ثلاث خطوات، إنشاء نموذج المستخدم، والعثور على أقرب مجموعة جيران وإنشاء توصيات.
خوارزمية التصفية العنقودية والتعاونية: لأن عدد كتب المكتبة الجامعية، غالباً ما يكون كبير للغاية. نتيجة لذلك، قد تكون مصفوفة عنصر المستخدم كبيرة جدًا ومتناثرة، مما يؤدي إلى ظهور التحديات في أداء التوصية. لن يقرأ المستخدمون الأكثر نشاطًا سوى مجموعة فرعية صغيرة من قاعدة البيانات الإجمالية. ندرة مصفوفة كتاب المستخدم تصل إلى 99.99٪.
خوارزمية التوصية على أساس المحتوى: تعتمد طرق التصفية المستندة إلى المحتوى على وصف الكتاب وملف تعريف تفضيل المستخدم. تحاول هذه الخوارزمية التوصية بالكتب التي تشبه تلك التي أحبها المستخدم في الماضي.
في النهاية، وبعد هذا العرض لأنظمة التوصية، يمكننا القول الأساليب الهجينة، التي تجعل التنبؤات القائمة على المحتوى والقائمة على التعاون بشكل منفصل والجمع بينها، قد تكون أكثر فعالية في أنظمة التوصية بالكتب.