library management & Higher Education blog

عن مدونة نسيج

تهدف مدونة نسيج الى توفير مساحات تشاركيه تتسع لكل المتخصصين والمهتمين بكل ما هو جديد في مجال المكتبات والتعليم العالي والتعلم عن بعد وتقنيات المعلومات والاتصالات وتقنيات الأرشفة وحلول المعرفة المتقدمة في التعليم العالي، المكتبات، ومراكز الأبحاث.

سجل بريدك الالكتروني هنـا لتصلك أحدث التدوينات

أكاديمية نسـيج على الفيسبوك

 
 

مقــالات حديثة

نقاط الجودة للاستعلامات: البيانات المنظمة والاستعلام الدلالي والاستعلام المتزايد

نُـشر بواسطة هيام حايك on 24/09/2018 10:01:05 ص

 3-44547

غالبًا ما تؤدي مصطلحات الاستعلام القصيرة إلى نتائج بحث غير ذات صلة بسبب عدم وجود سياقات ملائمة قادرة على تحديد نية المستخدم الحقيقية وبالتالي تبدأ أخطاء البحث. بدون دقة عالية من مادة الاستعلام لن نتلقى نتائج بحث دقيقة، نظرًا لأن إدخال السيء يؤدي إلى فقط إنتاج سيء. صياغة الاستعلام الجيد، والمعالجة المسبقة مهمة للحصول على مستندات ذات صلة عالية.

ماذا نعني بالاستعلام Query

الاستعلام هو الوسيلة المستخدمة للبحث عن السجلات التي تفي بإجابة سؤال معين عن البيانات المخزنة ولاستعلامات Queries هي عبارة عن اسئلة عن معلومات مطلوب استخراجها. ويعرف البعض الاستعلامات Queries إلى كونها عبارة أو كلمة تعبر عن وظيفة أو أمر أو عنوان أو قائمة يتم إدخالها في محطات الاستعلام في هيئة أوامر أو طلب استرجاع بيانات من ملف معين. ببساطة الاستعلام (query) وهو طريقة يَستعين بها لجلب البيانات.  ومن أهم وظائف الاستعلام استخلاص البيانات التي تحقق شروط معينة من الجداول سواء كان أفقيا أو رأسيا وعرض البيانات مرتبة أبجديا أو رقميا تصاعدي أو تنازلي، بالإضافة إلى إنشاء الحقول المشتملة على تعبيرات رياضية مبنية على حقل أو أكثر. كما يتم استخدام الاستعلام كمصدر بيانات للنماذج والتقارير وربط البيانات بين أكثر من جدول واستخراج معلومات تلخيصيه ومجمعه لبيانات الحقول.

الاستعلام المتزايد Query Augmentation

 ويعرف أحيانا باستعلام الزيادة، والذي يتمثل في القدرة على إرجاع نتائج البحث الخام عالية الدقة في الواجهة الأمامية عامل مهم بالنسبة لوحدات إعادة الترتيب لإظهار إمكاناتها بالكامل. ومن الواضح أن هذه القدرة مرتبطة بالقدرة على مطابقة شروط البحث مع تلك الإجابات غير المعروفة في المستندات بمساعدة نية المستخدم المعروفة. لحل مشكلة البحث عن الإجابة والمطابقة، يمكن للمرء أن يحاول معرفة الأنماط اللغوية والنحوية الممكنة للجمل التي تحتوي على الإجابات المطلوبة المرتبطة بمصطلحات البحث والنية. ثم يتم استخدام الأنماط النحوية لجمل الإجابة لمطابقة المستندات، بدلاً من استخدام بعض مصطلحات الاستعلام الدلالية وغير المعدلة. على سبيل المثال، للعثور على تاريخ ميلاد بيل غيتس، يمكننا زيادة المصطلح الرئيس "Bill Gates" مع سياق "ولد في "، وتقديم رمز الاستعلام الدلالي "ولد بيل جيتس في "إلى محرك البحث، بدلا من تقديم" Bill Gates "بالإضافة إلى" عيد ميلاد "عن طريق الاستدلال. من المرجح أن تتضمن المستندات التي تطابق نمط الاستعلام الدلالي هذا الإجابة الصحيحة "(ولدت بيل غيتس) في 28 أكتوبر 1955".

يلعب نمط التكبير "ولدت على" لعبارة الاستعلام الدلالية والمطلوبة "بيل غيتس" دورًا لتقييد مساحة البحث إلى هدف المستخدم الخاص "عيد الميلاد". على عكس أساليب توسيع طلب البحث الأخرى، والتي قد تعرض مساحة بحث أكبر وموسعة مع توسيع نطاق الاستعلام، وبالتالي قد تؤدي إلى أخطاء بحثية مفرطة، فنحن في الواقع نقلل مساحة البحث باستخدام أنماط معجمية ونحوية أكثر دقة لمطابقة الإجابات،

. يمكن أن يكون الاستعلام المتزايد عبارة عن استعلام يحقق أداءً جيدًا في تحديد موقع المستندات المطلوبة المحددة في نتائج البحث. يمكن تحديد أداء الاستعلام المتزايد من خلال تفاعلات المستخدم. على سبيل المثال، إذا كان العديد من المستخدمين الذين يقومون بإدخال نفس طلب البحث غالبًا ما يقومون بتحديد واحد أو أكثر من نتائج البحث ذات الصلة بطلب البحث، فقد يتم تعيين هذا الاستعلام تحت بند الاستعلام المتزايد.

بالإضافة إلى الاستعلامات الفعلية المقدمة من قبل المستخدمين، يمكن أيضًا أن تتضمن طلبات البحث الدلالية وهي طلبات بحث مجمعة تم إنشاؤها آليًا. على سبيل المثال، يمكن تحديد استعلام زيادة عن طريق استخراج مجموعة من الوثائق وتحديد مصطلحات البحث التي تكون الوثائق الشائعة ذات صلة بها. يمكن أن تحتوي هذه المستندات الشائعة، على سبيل المثال، على مستندات يتم تحديدها غالبًا عند تقديمها كنتائج بحث. هناك طريقة أخرى لتحديد الاستعلام المتزايد من خلال عملية التنقيب في البيانات الهيكلية، على سبيل المثال، قوائم هاتف العمل، وتحديد الاستعلامات التي تتضمن مصطلحات البيانات المنظمة، على سبيل المثال، أسماء الأنشطة التجارية.

يمكن تخزين استعلامات الزيادة هذه في مخزن بيانات خاص بها. عندما يقوم مستخدم بإرسال استعلام بحث إلى محرك بحث، يمكن تقييم شروط الاستعلام المقدم ومطابقتها مع مصطلحات استعلامات التعزيز المخزنة لتحديد واحد أو أكثر من استعلامات الزيادة التشابه. يمكن استخدام استعلامات التعيين المحددة، بواسطة محرك البحث لزيادة عملية البحث، وبالتالي الحصول على نتائج بحث أفضل. على سبيل المثال، يمكن تقديم نتائج البحث التي تم الحصول عليها بواسطة استعلام زيادة مماثل إلى المستخدم مع نتائج البحث التي تم الحصول عليها بواسطة استعلام المستخدم.

في مارس الماضي، مُنحت شركة Google براءة اختراع تتضمن منح نقاط الجودة للاستعلامات. تشير البراءة إلى طلبات البحث ذات النقاط العالية كطلبات للبحث المتزايد. من المثير للاهتمام أن اختيار الباحث هو إحدى الطرق التي يمكن استخدامها لتحديد جودة طلبات البحث. لذلك، عندما يبحث شخص ما. قد تقوم Google بمقارنة عينات النظام المنسَّق (SERP) التي تتلقاها من طلب البحث الأصلي إلى نتائج الاستعلام المُعزَّز استنادًا إلى عمليات البحث السابقة باستخدام مصطلحات طلب البحث نفسها أو طلبات البحث الدلالي. يستند هذا التقييم ضد طلبات البحث على نتائج البحث التي حصلت على مزيد من النقرات في الماضي. قد تقرر Google إضافة نتائج من استعلام زيادة إلى نتائج الاستعلام الذي تم البحث عنه لتحسين نتائج البحث الكلية.

كيف تجد جوجل استفسارات الزيادة؟

للحصول على استعلامات الزيادة، يمكن للنظام الفرعي للاستعلام المتزايد أن يفحص بيانات الأداء التي تشير إلى تفاعلات المستخدم لتحديد الاستعلامات التي تحقق أداءً جيدًا في تحديد موقع نتائج البحث المرغوب فيها. على سبيل المثال، يمكن تحديد استعلامات دلالية عن طريق سجلات استعلامات التنقيب والنقر على السجلات. باستخدام سجلات الاستعلام، على سبيل المثال، يمكن لنظام فرعي للاستعلام المتزايد أن يحدد استعلامات المستخدم الشائعة. يمكن استخدام سجلات النقرات لتحديد استعلامات المستخدمين التي تحقق أفضل أداء، كما هو موضح في عدد النقرات المرتبطة بكل طلب بحث. يخزن النظام الفرعي للاستعلام الزائد استعلامات الزيادة المستخرجة من سجلات الاستعلام و / أو سجلات النقرات في مخزن الاستعلامات الدلالية.

هذا لا يعني أن Google تستخدم النقرات لتحديد الترتيب مباشرة، ولكنها تحدد استفسارات الزيادة التي قد تكون مفيدة في استخدامها للتزويد  SERPs أي “صفحات نتائج محرك البحث”، وهي قائمة النتائج التي تظهر لك عند البحث عن كلمة معينة وتضم هذه الصفحة 10 نتائج يظهر فيها عنوان ووصف كل مقال، وتظهر هذه النتائج بسبب ان الكلمة المفتاحية التي بحث بها المستخدم توجد في عنوان ووصف ومحتوى كل صفحة من هذه النتائج العشرة.

 كيف تقوم Google بإنشاء واستخدام الاستعلامات الدلالية

الاستعلامات الدلالية هي طلبات بحث تم إجراؤها بواسطة محرك البحث بدلاً من البحث البشري. من المنطقي أن تستكشف Google مساحات طلب البحث بطريقة مماثلة، لمعرفة النتائج التي تشبه الاستعلام، واستخدام معلومات مثل البيانات المنظمة كمصدر لتلك الاستعلامات الدلالية.  خوارزميات البحث الدلالي semantic search تقوم بإعطاء الأولوية للسياق context عوضًا عن مطابقة كلمات البحث تمامًا. يضم الويب الدلالي مصادر الويب المنشأة حديثاً وتلك التي زودت بوسائل المعالجة الحاسوبية (الدلالية) لتصبح متوافقة للويب الدلالي. وبما أن المستخدم يبحث عن مضمون تلك الملفات مثل التي تتحدث عن موضوع ما، على سبيل المثال عن ناس، حوادث، شركات، بلدان، رياضة, طعام، تطور، علوم... مواضيع عديدة تتحدث عن أفراد... أو في كلمة واحدة مكونات  entity، إذا الويب الدلالي هو عكس الويب الحالي. هو ويب مع كيانات. فهو يصف العلاقات بين الأشياء وخصائصها عن طريق استخدام مجموعة من الأدوات التي تساعد في تحقيق ذلك مثل: لغة الترميز الموسعة، وخرائط المفاهيم أو الأنطولوجي، والمعيار العام لوصف المصادر ولغة أنطولوجيا الويب

 

 

وفي وجود كمية ضخمة جدًّا من البيانات، فإنّ البحث الدلالي يخطو خطوة إضافية مُقارنة بالبحث التقليدي الذي يستخدم الكلمات المفتاحية، ويخوض إلى مستوى أعمق من مجرّد البحث عن الكلمات المُدخلة.

كيف يتعامل Google  مع البيانات المنظمة

يسعى أصحاب مواقع الإنترنت إلى تقديم مواقعهم في محركات البحث بشكل جيد وظهورها في نتائج البحث في اماكن متقدمة، وهذا العمل يتطلب فهم واضح للطريقة الصحيحة لعمل ذلك. هنا تأتي “البيانات المنظمة Structured Data ”  وهي عباره عن بيانات ذات ترتيب وتنظيم عالي تم ويتم حفظها في قاعدة بيانات علائقيه تسهل لمحركات البحث الوصول إليها وعرضها بطرق مبتكره.

كان المتحدثون الرسميون من Google يخبروننا أن البيانات المنظمة لا تؤثر على الترتيب مباشرةً، ولكن يبدو أن ما تم قوله قد تغير مؤخرًا. حيث من الواضح أن البيانات المهيكلة لا تقدم لك ترتيبًا في التصنيف ولكن يمكن أن تساعد في الترتيب، ولكن في حالة البيانات المنظمة عند استخدام إحدى الصفحات استعلام دلالي ، وتلبي الحد الأدنى من الأداء كاستعلام زيادة ، قد تظهر في الترتيب، ذلك يعني البيانات المنظمة Structured Data  الطريق الأسرع لمحركات البحث.

الإشارات الضمنية لجودة الاستعلام

إنها موضوع مثير للاهتمام لأنها تتحدث عن أشياء مثل النقرات الطويلة والنقرات القصيرة، وترتيب صفحات الويب على أساس هذه الأشياء. يستخدم محرك البحث تقنية Long Click “النقرة الطويلة هي أطول فترة يقضيها الباحث أو الزائر داخل النتيجة التي نقر عليها. فإذا كان بقاءه لمدة زمنية طويلة، هذا يعني أن هذه النتيجة مفيدة وحققت له ما يبحث عنه.وإذا كان بقاءه لمدة زمنية قصيرة، هذا يعنى أن النتيجة لم تكن مفيدة، وسينتقل إلى نتيجة أخرى. عندما توفر احتياجات الزائر أو الباحث، لن يقوم بالانتقال إلى نتيجة أخرى، والبقاء لأطول فترة ممكنة داخل موقعك، ليفهم جوجل مباشرة أن محتوى موقعك يوفر للباحث كل ما يريد, دون الحاجة للانتقال الى نتائج أخرى والبحث عن معلومات أخرى غير متوفرة داخل موقعك. تعتبر Long Click  أهم عامل من عوامل  PageRank

في بعض التطبيقات، يتم استخدام الإشارات الضمنية لجودة الاستعلام لتحديد ما إذا كان يمكن استخدام الاستعلام كاستعلام زيادة ومن هنا فإن الإشارة الضمنية هي إشارة تستند إلى إجراءات المستخدم استجابةً لطلب البحث. يمكن أن تتضمن أمثلة إشارات ضمنية معدلات نقر إلى الظهور click-through rates (CTR) ذات صلة بطلبات بحث مختلفة، ومقاييس نقرة طويلة و / أو حالات النقر إلى الظهور، كما هو مسجل في سجلات النقرات. يمكن أن يحدث النقر فوق طلب البحث، على سبيل المثال، عندما يقوم مستخدم جهاز بتحديد "نقرات" في إحدى نتائج البحث التي يتم إرجاعها بواسطة محرك بحث. يتم الحصول على نسبة النقر إلى الظهور عن طريق قسمة عدد المستخدمين الذين قاموا بالنقر فوق إحدى نتائج البحث بعدد مرات إرسال الاستعلام. على سبيل المثال، إذا تم إدخال طلب البحث 100 مرة، وكان 80 شخصًا ينقرون على نتيجة بحث ، فإن نسبة النقر إلى الظهور لهذا الاستعلام تبلغ 80٪.

تحدث النقرة الطويلة عندما يسكن المستخدم، بعد النقر فوق إحدى نتائج البحث، في الصفحة المقصودة (أي المستند الذي ترتبط به نتائج البحث) بنتيجة البحث أو ينقر على الروابط الإضافية الموجودة على الصفحة المقصودة. يمكن تفسير النقرة الطويلة على أنها إشارة إلى أن طلب البحث حدد المعلومات التي اعتبرها المستخدم مثيرة للاهتمام، حيث أن المستخدم أمضى بعض الوقت على الصفحة المقصودة أو وجد عناصر إضافية ذات أهمية على الصفحة المقصودة.

يحدث الارتداد من خلال النقر A click-through reversion (المعروف أيضًا باسم "النقرة القصيرة") عندما يعود المستخدم بعد النقر على إحدى نتائج البحث ويتم تقديم المستند المشار إليه، بسرعة إلى صفحة نتائج البحث من المستند المشار إليه. يمكن تفسير الارتداد من خلال النقر على أنه إشارة إلى أن الاستعلام لم يحدد المعلومات التي اعتبرها المستخدم مثيرة للاهتمام، حيث عاد المستخدم بسرعة إلى صفحة نتائج البحث.