ما هي أنواع أنظمة التوصية؟

ما هي أنواع أنظمة التوصية؟.

يعتمد نجاح أدوات التوصية مثل Netflix ، التي تقترح علينا الأفلام ، أو حتى Amazon ، التي تنصحنا بالكتب ، على ثلاثة مناهج رئيسية ندعوك لاكتشافها في هذه المقالة.

في السياق الحالي لطوفان البيانات والمعلومات ، تعد تقنيات الكمبيوتر لتسهيل البحث وكذلك استخراج المعلومات ذات الصلة مساعدة مفيدة في صنع القرار. واحد منهم هو التوصية.

تمت دراسة أنظمة التوصية في العديد من المجالات [Neg15b] : البحث عن المعلومات ، الويب ، التجارة الإلكترونية ، استغلال استخدامات الويب وغيرها الكثير.

أشهر خوارزميات التوصية هي تلك المستخدمة في مواقع التجارة الإلكترونية. في الواقع ، مواقع مثل أمازون.كوم أو ما شابه ذلك من مزودي الخدمة عبر الإنترنت يسعون جاهدين لتقديم بعض الاقتراحات لكل مستخدم بشأن المنتجات التي قد يرغبون في شرائها.

المبدأ هو استخدام مصالح العميل كمدخلات لإنشاء قائمة بالمنتجات الموصى بها. تعتمد العديد من التطبيقات فقط على المنتجات التي يشتريها العملاء ويقيمها بشكل صريح لتمثيل اهتماماتهم ، ولكن يمكن لهذه الأنظمة أيضًا أن تأخذ في الاعتبار سمات أخرى ، بما في ذلك المنتجات المعروضة ، والمعلومات السكانية ، والفنانين المفضلين.

في أنظمة الاقتراحات ، عادةً ما يتم تمثيل فائدة عنصر ما من خلال درجة تشير إلى مدى إعجاب مستخدم معين بعنصر معين.

المشكلة الرئيسية التي يجب حلها هي تقدير الدرجات للعناصر التي لم يتم تقييمها من قبل المستخدم بعد. يمكن أن يكون عدد العناصر وكذلك عدد مستخدمي النظام كبيرًا جدًا ؛ هذا يجعل من الصعب على كل مستخدم رؤية جميع العناصر أو أن يتم تصنيف كل عنصر من قبل جميع المستخدمين. عندما يكون من الممكن تقدير الدرجات للعناصر التي لم يتم تصنيفها بعد ، يمكن التوصية بالعناصر ذات أعلى الدرجات المقدرة للمستخدم.

ضع في اعتبارك المثال التالي ، حيث يقيم المستخدمون الأفلام. يوضح الجدول أدناه الدرجات المعروفة لكل مستخدم (في السطر) ولكل فيلم (في العمود).

مثال 1

ش (ج ، ط) هاري بوتر العصر الجليدي العصر الجليدي 2 OSS 117 مرحبا بكم في Ch’tis
إلسا 8 2 7
متزوج 9 8 3 6
أرنو 3 5 5
باتريك 5 3 3 3

يتم تصنيف أنظمة التوصية وفقًا للنهج المستخدم لتقدير الدرجات المفقودة.

  • الطريقة القائمة على المحتوى: سيوصى المستخدم بعناصر مماثلة (بمعنى مقياس التشابه بين العناصر) لتلك التي كان يفضلها في الماضي.
    في المثال أعلاه ، صنفت Elsa أفلام “Ice Age” و “Bienvenue chez les Ch’tis” تقريبًا بنفس الطريقة. نلاحظ أيضًا أن خصائص أفلام “Ice Age” و “Ice Age 2” “قريبة جدًا”. لذلك ، يوصي النظام بإلقاء فيلم “Ice Age 2” على إلسا ، ويخصص لها أفضل نتيجة أعطتها لفيلمي “Ice Age” و “Bienvenue chez les Ch’tis” ، أي 8.
  • الطريقة التعاونية أو القائمة على التصفية التعاونية: سيُنصح المستخدم بالعناصر التي يحبها المستخدمون الآخرون الذين لديهم أذواق وتفضيلات مماثلة (بمعنى التشابه بين المستخدمين والعناصر) في الماضي.
    دعنا نعود إلى المثال 1 أعلاه. مثل كل من Elsa و Marie مثل “Ice Age” و “Bienvenue chez les Ch’tis” ولم يعجبهما “OSS 117” ؛ تشير آرائهم المتشابهة حول هذه الأفلام إلى أن ماري وإلسا لديهما نفس الرأي بشكل عام. لذا فإن “هاري بوتر” هو توصية جيدة لإلسا ، لأن ماري تحبها. وهكذا فإن النظام يخصص لفيلم “هاري بوتر” ، بالنسبة إلى إلسا ، الدرجة التي أعطتها ماري لهذا الفيلم ، أي 9.
  • الطريقة الهجينة: مزيج من الطريقتين السابقتين.

النهج القائمة على المحتوى

للحصول على توصيات على أساس المحتوى (انظر [PB07] لمزيد من التفاصيل) ، تتمثل المهمة في تحديد العناصر الموجودة في الكتالوج التي تتوافق بشكل أفضل مع تفضيلات المستخدم. لا يتطلب مثل هذا الأسلوب وجود مجتمع مستخدم كبير أو سجل استخدام كبير للنظام. يوضح الشكل 1 هذه العملية.

 width=

الشكل 1: نظام توصية قائم على المحتوى (مقتبس من [JZFF10]).

أسهل طريقة لوصف كتالوج العناصر هي الحصول على قائمة صريحة بخصائص كل عنصر (تُعرف أيضًا بالسمات وملف تعريف العنصر وما إلى ذلك). بالنسبة للكتاب ، على سبيل المثال ، يمكن للمرء استخدام النوع أو اسم المؤلفين أو الناشر أو أي معلومات أخرى تتعلق بالكتاب ، ثم تخزين هذه الخصائص (في قاعدة بيانات على سبيل المثال).

يتم التعبير عن ملف تعريف المستخدم في شكل قائمة اهتمامات على أساس نفس الخصائص. يمكن قياس التطابق بين خصائص العناصر والملف الشخصي للمستخدم بطرق مختلفة:

  • مؤشر النرد أو مقاييس التشابه الأخرى [BYRN99]و
  • TF-IDF (مصطلح وثيقة عكس التردد) [SWY75]و
  • تقنيات تعتمد على تشابه مساحات المتجهات (مناهج بايزي [PB07]، وأشجار القرار ، وما إلى ذلك) إلى جانب الأساليب الإحصائية ، عندما يكون هناك عدد كبير جدًا من الكلمات الرئيسية.

تتمتع أنظمة التوصية القائمة على المحتوى بالمزايا التالية:

  • يوصون بعناصر مشابهة لتلك التي أحبها المستخدمون في الماضي ؛
  • يأخذون في الاعتبار ملف تعريف المستخدمين وهو المفتاح للحصول على التوصيات الأكثر صلة لكل واحد ؛
  • تعمل مطابقة تفضيلات المستخدم مع خصائص العنصر مع العديد من أنواع البيانات (نصية ورقمية وما إلى ذلك) نظرًا لاستخدام قوائم الكلمات الرئيسية عادةً ؛
  • البيانات المتعلقة بالمستخدمين الآخرين عديمة الفائدة ؛
  • لا توجد مشكلة بداية باردة عند إضافة عنصر جديد إلى الكتالوج أو كثافة منخفضة نظرًا لأن الأمر يتعلق بمطابقة تفضيلات المستخدم وخصائص العناصر ؛
  • من الممكن تقديم توصيات للمستخدمين ذوي الأذواق “الفريدة” ؛
  • من الممكن التوصية بعناصر جديدة أو حتى عناصر غير شائعة.

ومع ذلك ، فإن هذه الأنظمة لها أيضًا عيوب:

  • لا يمكن تمثيل كل المحتوى بكلمات رئيسية (مثل الصور) ؛
  • لا يمكن تمييز العناصر الممثلة بنفس مجموعة الكلمات الرئيسية ؛
  • المستخدمون الذين شاهدوا عددًا كبيرًا جدًا من العناصر يمثلون مشكلة (الكثير من المعلومات في ملف تعريف المستخدم لمطابقة خصائص العناصر) ؛
  • عندما يبدأ مستخدم جديد في استخدام النظام ، لا يوجد سجل ؛
  • يظهر خطر “الإفراط في التخصص” ، أي أننا نقصر أنفسنا على عناصر متشابهة وأن الإجابات متجانسة للغاية ؛
  • لا يزال من الصعب تطوير ملفات تعريف المستخدمين ، والأهم من ذلك ، يجب مراعاة تطور اهتمامات المستخدم ؛
  • لكي ينتج النظام توصيات دقيقة ، يجب على المستخدم توفير أ استجابة على الاقتراحات عاد ولكن هذا يستغرق وقتا طويلا بالنسبة له ؛
  • أخيرًا ، تعتمد هذه الأنظمة بالكامل على درجات العناصر ودرجات الاهتمام: فكلما قل عدد الدرجات ، كانت مجموعة التوصيات الممكنة محدودة.

مثال 2
ضع في اعتبارك كتالوج الكتب ، مثل المقتطف الموضح في الجدول 1 ، جنبًا إلى جنب مع مقتطف ملف تعريف المستخدم Mary ، استنادًا إلى مشترياتها السابقة من الكتب والمعلومات التي قدمتها بخصوص تفضيلاتها ، كما هو موضح في الجدول 2. نريد اقتراح كتب لـ ماري التي قد تعجبها. إنها مسألة مطابقة الجدول 1 والجدول 2 وتحديد أفضل الكتب التي تتوافق مع تفضيلات ماري. يلخص الجدول 3 التطابق بين الجدولين الآخرين (نعم: تطابق المعلومات ؛ لا: المعلومات غير متطابقة). وهكذا من الجدول 3 ، حدسيًا ، يمكن التوصية بكتاب “Shining” و “Millenium” لماري (نظرًا لأن خصائص هذين الكتابين تتوافق بشكل أفضل مع تفضيلات ماري).

عنوان جنس الكاتب سعر الكلمات الدالة
ساطع إثارة إس كينج 19.50 إدمان الكحول ، كولورادو ، متوسط ​​، خارق للطبيعة ، فندق ، …
الألفية الشرطي إس لارسون 23.20 صحافة ، تحقيق ، قتل ، السويد ، سياسة ، …
مذكرات بريدجيت جونز رومانسي H. فيلدينغ 8.50 عزباء ، فكاهة ، حب ، ثلاثون ، يوميات ، …

الجدول 1 : مقتطف من كتالوج الكتب.

بطاقة تعريف 1
معلومات شخصية الاسم الاول متزوج
الجنس النساء
كتب الأنواع إثارة ، جريمة
المؤلفون إس كينج ، إم كونيلي
ضمانات دكتور سليب ، جويلاند ، التدخل الانتحاري ، دارلينج ليلي ، …
الكلمات الدالة محقق ، جريمة قتل ، خارق للطبيعة ، …
متوسط ​​السعر 20
أفلام الأنواع شباب ، كاريكاتير ، فكاهة
مخرج جي لوكاس

الجدول 2 : مقتطفات من ملف تعريف المستخدم ماري.

خيارات المستخدم ساطع الألفية بريدجيت جونز
جنس نعم نعم لا
سعر نعم نعم نعم
الكاتب نعم لا لا
الكلمات الدالة نعم نعم لا

الجدول 3: التطابق بين خصائص الكتب وتفضيلات ماري المشار إليها في ملفها الشخصي.

في الممارسة العملية: راديو الويب باندورا

باندورا هو راديو ويب (يمكن الوصول إليه فقط في الولايات المتحدة) يشتمل على خدمة توصية موسيقية آلية تم إنشاؤها بواسطة مشروع Music Genome Project (مشروع جينوم الموسيقى).

في باندورا، يشير المستخدم أولاً إلى اسم الفنان أو عنوان الموسيقى. ثم يعتني النظام باستمرار القائمة الموسيقية ، واختيار العناوين الموسيقية التي تقترب من الاختيار الأول.

يتم تحليل الأصوات والآلات والتأثيرات والإيقاعات وما لا يقل عن 400 جانب موسيقي لكل موسيقى جديدة وذخيرة باندورا تضم أكثر من 10000 فنان.

على سبيل المثال ، إذا كنت تحب أغاني أريثا فرانكلين ، فلن تتمكن فقط من الوصول إلى مجموعة الأغاني لهذا الفنان ، ولكن أيضًا العديد من العينات الموسيقية لمغني الجاز والسول والإيقاع والبلوز ، مثل دينا واشنطن وإيتا جيمس.

بالإضافة إلى ذلك ، لكل عنوان جديد يقدمه النظام ، يمكن للمستخدم تقييمه بشكل إيجابي أو غير موات ، مما يجعل من الممكن تحسين خيارات النظام. يتم تقديم أربعة خيارات للمستخدم:

  1. “الإبهام لأعلى” (الإبهام مقلوب لأعلى) مما يشير إلى باندورا لتشغيل المزيد من الموسيقى المشابهة لهذه ،
  2. “0 استجابة” مما يشير إلى …

هل كان المقال مفيداً؟شاركه مع أصدقائك ولا تنسى لايك والتعليق


Comments

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *