كيف تعرف ما إذا كانت التوصية ذات صلة؟

كيف تعرف ما إذا كانت التوصية ذات صلة؟.

بالطبع ، تم صقل هذه التقنيات وتحسينها على مدار العشرين عامًا الماضية. من الناحية العملية ، اتضح أن حساب أوجه التشابه بين المستخدمين غالبًا ما يكون معقدًا للغاية. من الأفضل عكس المشكلة من خلال البحث أولاً عن أوجه التشابه بين المنتجات. هذا ما تفعله أمازون من خلال الإشارة إلى العناصر التي “اشتراها العملاء الذين اشتروا هذه السلعة أيضًا”. تظهر التجربة أن النتائج أقل إقناعًا بكثير.

الشكل 4 – توصيات المنتج على أمازون.

بعض الصعوبات للتغلب عليها

تشكل أنظمة الاقتراحات الآلية مشكلات فنية مختلفة لمصمميها. من الضروري بالفعل تقييم آراء ملايين المستخدمين حول عشرات الآلاف من المنتجات. يتطلب إجراء مقارنات بين كل صف من المصفوفة مع الآخرين الكثير من العمليات ، ومكلفة من حيث الأداء. إذا كان من الممكن الاحتفاظ بعناصر معينة من الحساب وإعادة استخدامها ، فيجب أن يأخذ البعض الآخر في الاعتبار تحديثات المصفوفة (عندما يصنف المستخدمون كائنًا ، على سبيل المثال). حجم الأنظمة له أيضًا تأثير آخر يقلل من إمكانية اقتراح التوصيات ذات الصلة: تم تصنيف كل كائن بشكل عام من قبل مجموعة صغيرة جدًا من الأشخاص ، مما يجعل من الصعب العثور على مستخدمين مشابهين. (بمعنى آخر ، المصفوفة مليئة بالأصفار ؛ تسمى مصفوفة “متفرقة” جدًا).

بالإضافة إلى مشاكل الأبعاد هذه ، والتي تم تطوير تقنيات مختلفة لها ، يجب أن تواجه أنظمة التوصية صعوبات أخرى. مثل ، على سبيل المثال ، “البداية الباردة”. هذه هي المشكلة الخاصة التي يطرحها المستخدمون الجدد للنظام. بما أننا لا نعرف شيئًا عنهم ، كيف يمكننا أن نقدم لهم التوصيات ذات الصلة؟ يجب أن نقتصر على التوصية بالعناصر الشائعة (الأكثر مبيعًا ، على سبيل المثال) مع المخاطرة بالتوصية بالمنتجات الموجودة لديهم بالفعل أو التي لا تهمهم.

سوف نذكر مشكلة رئيسية أخيرة ، هي التنوع ، أو بالأحرى غياب التنوع. يتجلى هذا على مستويين ، عالمي (للنظام بأكمله) ومحلي (لكل مستخدم).

يتكون الافتقار إلى التنوع الشامل من التوصية بالكائنات الشائعة فقط للمستخدمين. يتلقى الكائن المرئي القليل جدًا تقييمات قليلة ولا يُنصح به أبدًا. وعلى العكس من ذلك ، فإن التوصية المنتظمة بالعناصر الشائعة تزيد من شعبيتها.

يتمثل غياب التنوع المحلي في التوصية للمستخدم فقط بالأشياء المتعلقة بمراكز الاهتمام التي يعرفها النظام. هذا التأثير يعزز ذاتيًا بمرور الوقت. وبالتالي ، من غير المرجح أن يُعرض على محبي أفلام الرعب أعمال كوميدية رومانسية أو ، في سياق آخر ، أن تعرض مؤيد هيلاري كلينتون لمقالات مؤيدة لدونالد ترامب.

للتعويض عن نقص التنوع ، من الممكن بالطبع تعديل الخوارزمية الموجودة في قلب النظام ، على سبيل المثال ، لإدخال المزيد من الصدفة للمستخدم أو لتحقيق توازن أفضل في الأرباح التجارية بين جميع البائعين الذين يعرضون المنتجات.

الخوارزميات ليست سوى عمليات نقل حاسوبية للقواعد التي يتبناها البشر. عندما لا ترضينا هذه الأشياء ، يمكننا جعلها تتطور … وفجأة نحول الخوارزميات المرتبطة بها.

رفائيل فورنييه سنيهوتا، محاضر في علوم الكمبيوتر في المعهد الوطني للفنون والحرف.

Usenet هو نظام مناقشة عبر الإنترنت ، يمكن اعتباره سلف المنتديات الحالية (أو حتى وظيفة “المجموعات” على Facebook)

حول تحليل دور فيسبوك في الانتخابات الأمريكية:

لمزيد من:
مؤلف هذه السطور هو عضو في مشروع ANR Algodiv ، الذي يدرس التنوع ضمن خوارزميات التوصية ؛
ستعقد ورشة عمل متعددة التخصصات حول أنظمة التوصية في 22 و 23 مايو في باريس ؛
حول التأثير الاجتماعي والسياسي لخوارزميات التصفية ، بالإضافة إلى عمل Dominique Cardon (Science-Po / Medialab) ، وهو أيضًا عضو في Algodiv ، يمكن للقراء المهتمين قراءة مدونة الباحث Olivier Ertzscheid ؛

لتعميق المعرفة بالخوارزميات المختلفة المطبقة ، تشكل سجلات مؤتمر ACM RecSys مرجعًا.هل كان المقال مفيداً؟شاركه مع أصدقائك ولا تنسى لايك والتعليق

Comments

اترك تعليقاً إلغاء الرد