2024208494886170954365459073536587125329324600425355324472245929212525005525530030271027810172575929800065427858557245242200073127892960531555

الخميس، 29 أغسطس 2019

استرجاع البيانات IR كيفية حساب الأوزان و اّلية عمل نموذج Boolean Model - الدرس الثالث

كيفية حساب الأوزان و اّلية عمل نموذج Boolean Model - الدرس الثالث

في الدرس السابق قمنا بشرح أنواع نماذج الكلاسيك وكيف انها تعتمد على تصنيف الكلمات مفيده وغير مفيده واعطاء الكلمات المفيدة أوزان وبناءاً على تقارب هذه الأوزان مع طلب المستعلم سيتم ترتيب الوثائق الراجعة  في نظام البحث.
وقد بدأنا بشرح اول نموذج وهو البولين وعرفنا ان قيم الاوزان هنا هي 0 و1 في هذا الدرس سوف نتعلم ما هي التعابير المنطقيه لهذا النموذج وكيف يتم احتساب اوزان الكلمات واستخراج الاستعلام الذي يبحث عنه المستخدم وكيف يقوم النموذج بارجاع بيانات مطابقه لبحث المستعلم.


Boolean Expression Symbol

لكل تعبير في تعبيرات نظام Boolean هنالك رموز خاصه كما هو موضح في الجدول:
Boolean Expression
Symbol
Connection
^
And
Or
~
Not

وبناءاً عليه لنفترض ان لدينا متجر لبيع الالكترونيات واراد المستعلم ان يبحث عن هاتف خلوي من نوع سامسونغ اس 10 و بطارية انكر فعليه سيكون بناء الرمز بالطريقة هذه:
مثال 1:
سامسونغ اس 10 ^ بطارية انكر
بينما لو كان طلب المستعلم هاتف سامسونغ اس 10 او بطارية انكر سيكون الرمز بالطريقة هذه:
مثال 2:
سامسونغ اس 10 ᵛ بطارية انكر
اما اذا كان المستعلم لا يريد جهاز سامسونغ  فسيكون الاستعلام بالطريقة هذه:
مثال 3:
~ سامسونغ اس 10

Boolean Operation

يجب ان نعلم ان اي كلمة في نظام البولين لها وزنين اما 1 او 0 بالتالي وبناءاَ على الامثلة السابقة فالعمليات لهاتف سامسونغ اس 10 وبطارية انكر ستكون نتائجها كالتالي:

مثال 1:

سامسونغ اس 10 ^ بطارية انكر



كما نعلم ان لكل كلمه احتمالين 0 و 1 وهذا ما بينه في الجدول السابق بالتالي سوف ينتج اربع احتمالات الان سوف نكمل المثال وهي وجود اس 10 و انكر لكل منهم قيمه 0

0 و 0 =0


لنكمل معال الاحتمال الثاني وهو اس 10 قيمته 1 بينما انكر قيمتها 0 بالتالي

1 و 0=0 فكما شرحنا سابقا هذا النموذج يقوم على التطابق التام هو يرد اس 10 و يريد انكر اذا لم يكون احد الطلبين موجودا فسيلغي الطلبة كاملة وتكون النتيجه  0 بالتالي ييضبح الجدول كتالي:



الان لننتقل الى الاحتمال الثالث وهو اس 10 قيمتها 0 وانكر قيمتها 1

0 و1 = 0 ايظا لان And في نظام البولين يجب ان يرجع تطابق تام فتصبح النتيجه كما يلي:


الأن الإحتمال الأخير اس 10 قيمتها 1 وانكر ايظا قيمتها 1
1و 1= 1 هنا يعني ان كل من اس 10 و انكر قيمتهما 1 اي موجودتنان بالتلي عندما يتم الاتعلام عنهما ب And سيرجع القيمة 1 اي نعم هما موجودتان معا وعندها سوف تكتمل العمليات الاربعه فيصبح الجدول كما يلي:


مثال 2:

سامسونغ اس 10 بطارية انكر
هنا ايظا اربع احتمالات هي
0 او 0
0 او 1
1او 0
1 او 1
الاحتمال الاول سيكون حتما النتيجه 0 والاحتمالا الاخير ستكون النتيجه حتما 1 لكن ماذا عن الاحتمال الثاني والثالث هل ستكون النتيجه 0 كما في مثال و And ام ان او هنا تلعب دورا مختلفا؟
في الحقيقه او هنا تعني ان على النظام ارجاع اي من هذا الاحتمالات الايجابية سواء وجد سامسونغ اس 10 بدون البطاريه فله ان يرجع نتيجه ايجابيه او وجد البطاريه انكر بدون اس 10 لفه ان يعيد نتيجه ايجابية وبناءا عليه سيكون الجدول كما يلي:



مثال 3:

~ سامسونغ اس 10
هنا فقط سوف نقلب وزن اس 10 لان Not تعني المعاكس للفيمه الحقيقية فعكس 0 هو 1 وعكس 1 هو 0
فستكون النتيجه كما يلي:
اس 10
0
1
1
0


لنقم بتجربه ما اذا ما كنت تمكنت من عمليات البانري في مثال جديد

مثال 4:

اس10 و ليس بطارية انكر
الحل:
اس 10 ^ ~ انكر

هل علمت الان لماذا الاحتمال الايجابي 1 هو الاحتمال الثاني وليس الرابع
لان انكر ستحمل اوزان مقلوبه ( 1 و 0 ) وليس ( 0 و 1) بالتالي سيكون الاحتمال الثاني هو انكر 1 وسامسونغ اس 10 1
1^1=1

 مثال على محرك البحث يعمل بـ Boolean Model:

الان لعتبر انك محرك بحث تحتوي قاعدة بياناتك على خمس وثائق لكل منها كلمات مرجعيه مفيده index هي:
الوثيقه 1: ( لعب، رياضة، كرة القدم، سباحة، جامعة،خاصة)
الوثيقة 2: ( العالم، اخبار، رياضة، جامعة)
الوثيقة 3: (كرة القدم، حكومية، جامعة، رياضة، لعب)
الوثيقة 4: ( جامعة، خاصة، رياضة، العالم)
الوثيقة 5: (لعب، العالم، جامعة، كرة القدم)
ثم قام المستعلم بطلب هذا الاستعلام Query والبحث عنه:
حكومية  ( جامعة ~  خاصة)

السؤال:

ما هي الوثائق الاقرب لطب المستعلم من الوثاق الخمس المحجوزه لمحرك البحث الخاص بك؟

الحل: 
الحل يكمن في ثلاث خطوات تبدأ
1- بناء قواعد البيانات للكلمات التي في محرك البحث وهي هنا 9 كلمات ،ثم وضع وزن لكل كلمه في كل وثيقه فإذا كانت موجودع في الوثيقه سيكون وزنها 1 وإلا فستكون 0.
2-  ثم بناء جدول لاحتمالات أوزان الإستعلام الذي طلبه الباحث المكون هنا من 3 كلمات: حكومية ( جامعة ~  خاصة) فستبداء من الاوزان 0 0 0 ثم نتنتهي ب 1 1 1 مع تطبق عمليات (and, or,not) واذا كانت النتيجه 1  اي ايجابية ننتقل الى المرحله الثالثة ولا نلغي هذا الاحتمال.
3- نبحث في الوثائق عن القيم المتطابقه مع تنفيذ عمليات   (and, or,not) التي عادت علينا بنتيجه ايجابية هي 1.

الخطوة الأولى:


هذا الجدول يعطي لكل لكمة وزنها في الوثيقه فاذا كانت موجوده فيصبح وزنها 1 واذا لم تكن يصبح وزنها 0

الخطوة الثانية: 

احتمالات طلب المستعلمquery
وهنا علينا اولاً أن نستخرج احتمالات الأوزان لثلاث كلمات كما طلب الباحث وهو مبين في الجدول التالي:

حكومية
جامعة
خاصة
حكومية  ( جامعة ~  خاصة)

النتائج
0
0
0


0
0
1


0
1
0


0
1
1


1
0
0


1
0
1


1
1
0


1
1
1



الان  سوف ندخل الاحتمالات في عملية الاستعلام query
حكومية  ( جامعة ~  خاصة) مع مراعات الأولويات الرياضيه فالأولوية هنا للأقواس كما هو معلوم رياضيا وبالطبع علينا ان لا ننسى اشارة ~  التي تقلب وزن الكلمه من 0 الى 1 ومن 1 الى 0:

لقد قمنا بتفصيل بعض الخطوات لتوضيح النتيجه التي توصلنا اليها 

الخطوة الثالثة: 
مطابقة النتائج الاجابية من الخطوه الثانية مع الوثائق التي تحمل هذه الاحتمالات من الخطوة الاولى:


إذا الوثيقه التي تحوي كلمة حكومية وتحتوي كلمة جامعة لكنها لا  تحتوي كلمة خاصة  بناءا على الجدول في الخطوة الاولى هي الوثيقة الثالثة

وهذا شرح لأول نموذج من نماذج عمل IR Classic Model في الدروس القادمة سوف نستوفي النماذج الأخرى وكيفيه عملها وحساب الأوزان فيها.










----------------------------------------------------------------------------------------------------------------------------------------- -----------------------------------------------------------------------------------------------------------------------------------------

كافة الحقوق محفوظة لـ مدونة رعد: لإثراء المعرفة التقنية 2019