Loading...

لاتفوتك فرصة خصم الاشتراك المبكر ٣٩٩ ريال لمعسكر تطوير اللغة الانجليزية

نماذج إسترجاع المعلومات

نماذج إسترجاع المعلومات

July 4, 2023 calendar icon

استكمالا لما بدأناه مسبقا حول استرجاع المعلومات ومراحلها ، نستعرض في هذا المقال أنواع نماذج استرجاع المعلومات وأهم هذه النماذج وكيفية عملها. الجدير بالذكر أن الهدف الأساسي لإسترجاع المعلومات هو الحصول علي المعلومات و المستندات ذات الصلة التي تلبي استعلام المستخدم بدقة كافية. 


أنواع نماذج استرجاع المعلومات (Information Retrieval Models):

        إن الهدف الرئيسي من نماذج استرجاع المعلومات هوأن النماذج تقوم بتوجيه البحث العلمي وتعزيز النتائج في المناقشات العلمية الاكادمية كما أنها تعد بمثابة مخطط تنفيذي فعلي لانظمة استرجاع المعلومات[1].  تتمحور مهمة نموذج استرجاع المعلومات حول تحديد التفاصيل لتمثيل المستندات ولتمثيل الاستعلام وأداء مهمة الاسترجاع [1] .


يمكن تصنيف نماذج استرجاع المعلومات إلي :

 1- النماذج الكلاسيكية : وهيا بمثابة أبسط النماذج وأسهلها في التنفيذ ، يعتمد هذا النموذج على المعارف الرياضية التي تم التعرف عليها [2]. النماذج الكلاسيكية المستخدمة في استرجاع المعلومات هي النموذج الاحتمالي (Probabilistic ) ، النموذج المنطقي(Boolean Model)  ، و نموذج المتجه (Vector Model) و سنتناول في هذا المقال الحديث عنهم بالأخص.

2- النماذج الغير كلاسيكية: تعتبر هذه النماذج هي علي عكس النماذج الكلاسيكية تماما ، حيث تعتمد علي مبادئ أخرى غيرالإحتمال والعمليات المنطقية والتشابه. نموذج منطق المعلومات (Information Logic Model) ونموذج نظرية الموقف (Situation Theory Model) ونماذج التفاعل(Interaction Model) هي أمثلة لهذا النوع من النماذج.


3- النماذج البديلة : 

يعتبر هذا النوع هو بمثابة تحسين أو تطوير للنوع الكلاسيكي باستخدام بعض التقنيات المحددة من بعض المجالات الأخرى.من أمثلة هذا النوع النموذج الضبابي (Fuzzy Model) ونماذج الفهرسة الدلالية المخفية (Latent Semantic Indexing Models)[2].


النموذج المنطقي (Boolean Model) :

          يعتبر النموذج المنطقي هو بمثابة أول نموذج استرجاع معلومات تم تطوير ، تمثل المستندات فيه عادة باستخدام مجموعة من الكلمات الرئيسية التي تم الحصول عليها من الفهرسة اليديوية [3]. يعتمد النموذج على نظرية المجموعات والجبر المنطقي ، حيث تكون المستندات عبارة عن مجموعات من المصطلحات والاستعلامات في صورة تعبيرات منطقية باستخدام الروابط المنطقية المختلفة مع هذه المصطلحات. علي سبيل المثال:

اذا كان مفرد الاستعلام (Query Term) هو كلمة “economics” ، بناء علي هذا المفرد يكون لدينا مجموعة م المستندات المفهرسة بهذا المفرد "economics"، اذا تم دمج المفرد ب الرابط المنطقي “AND” ستكون النتيجة تعريف مجموة من المستندات أقل أو تساوى المجموعة التي تم تعريفها في حالة المفرد منفردا ، بمعني أن الاستعلام الذي يحوى المفردات “economic”  and “social” سيقوم بانتاج مجموعة من المستندات المفهرسة بكلا المفرديين معا . واذا تم استخدام الرابط المنطقي “OR” سينتج مجموعة مستندات أكبر من أو تساوي مجموعات المستندات في الحالة الفردية. على سبيل المثال ، سيؤدي الاستعلام باستخدام المصطلحين "economic" or "social" إلى إنتاج مجموعة من المستندات المفهرسة إما بالمصطلح "economic" أو المفهرسة بالمصطلح "social" فسوف يكون العدد أكبر أو يساوى لانه سيسمح بحساب أي مستند فيه أحد المفردين وليس مشترطا للمستندات التي تحتوي الاثنين معا.


مميزات النموذج المنطقي:

1- سهولة الاستخدام والتنفيذ.

2- ارجاع المستندات المطابقة تماما فقط.

3- يعطي المستخدم احساسا بالتحكم الكامل في النظام.


عيوب النموذج المنطقي[2]:

1- لا يتم ترتيب النتائج التي يتم اراجعها.

2- دالة التشابة المستخدمة في النموذج هيا دالة منطقية بمعني لن يكون هناك مطابقات جزئية و قد يكون هذا مزعجًا لبعض المستخدمين.


نموذج المتجه (Vector Model):

          في هذا النموذج يحتوى نظام الاسترجاع(IR) علي عدد n من المفردات الرئيسية كما يتم تعريف فضاء ذي بعد n فيه يكو كل محور من محاوره مرتبط بأحد هذه المفردات الرئيسية ،كما يكون لكل مفرد من هذه المفردات الترجيح (Weight) الخاص به ، وباستخدام المتجهات داخل هذا الفضاء يتم تمثيل المستندات والاستعلامات  [4]، بمعني أن كل مستند يتم تمثيله باستخدام متجه ويتم تمثيل كل احداثئ أو محور بترجيح المفرد الرئيسي المقابل بحيث أنه كلما ذاد الترجيح ذاد ذلك من الإشارة لأهمية هذا المفرد بالنسبة للمستند. وفيما يتعلق بتمثيل الإستعلام فإن متجه الإستعلام يمثل بالقياس ، بمعني أن تعبر الترجيحات عن اهمية المفردات المقابلة لها لدي المستخدم فيتم اسناد الرقم 1 اذا كان المفرد مرغوب فيه 2 اذا كان المفرد غير مرغوب فيه [4]. الشكل التالي يوضح كيفية تمثيل المستندات باستخدام المتجهات وذلك لمجموعة من المفردات الاساسية “angina” , “gallstone”, “complication”


مميزات نموذج المتجه :

1- من السهل اسناد ترجيحات للمفردات الرئيسية في الاستعلام.

 2- يمكن استخدام مقياس التشابه والذي بواسطته يتم عرض النتائج وفقا لدرجة ترابطها والصلة مع الاستعلام .

3- قد تكون النتائج التي يمكن الحصول عليها عليها باستخدام نموذج المتجه أفضل من تلك التي يتم الحصول عليها مع النموذج المنطقي .


الخاتمة:

يعد استرجاع المعلومات من المجالات الفعالة والي تستفيد من انواع مختلفة من النماذج في توصيف كيفية تمثيل المستندات والاستعلامات لتحقيق أفضل النتائج . يتنبأ نموذج استرجاع المعلومات ويشرح ما سيجده المستخدم فيما يتعلق باستعلام معين .تتنوع هذه النماذج بين الكلاسيكي وبين الغير كلاسيكي والبديل . من أشهر هذه النماذج النموذج المنطقي ونموذج المتجه واللذان يعتمدات علي الأسس الرياضية المختلفة وتتنوع هذه النماذج في المميزات والعيوب المرتبطة بكل منهم .


المراجع :

 [1]: https://www.researchgate.net/publication/326075149_A_Survey_on_Information_Retrieval_Models_Techniques_and_Applications

[2]:https://www.tutorialspoint.com/natural_language_processing/natural_language_processing_information_retrieval.htm

[3]: https://www.researchgate.net/publication/281886222_Information_Retrieval 

[4]:https://www.sciencedirect.com/science/article/abs/pii/S1386505697000944