מערכות המלצה

מערכות לסינון מידע המנסות לחזות את העדפות המשתמש
יש לשכתב ערך זה. ייתכן שהערך מכיל טעויות, או שהניסוח וצורת הכתיבה שלו אינם מתאימים.
אתם מוזמנים לסייע ולתקן את הבעיות, אך אנא אל תורידו את ההודעה כל עוד לא תוקן הדף.

מערכות המלצה הן מערכות מוניטין ו/או מנגנונים שונים המשמשים כדי לסנן כמויות גדולות של מידע באמצעות הפצת תהליך של סינון בקרב קבוצה גדולה של אנשים. המערכות מספקות המלצות למשתמשים על פריטים שעשויים לעניין אותם. ההמלצות עוזרות למשתמשים לאתר פריטים רלוונטיים.

אופן היישום

עריכה

מערכות ההמלצה מתבססות על מידע שנאסף מהמשתמש או המשתמשים השונים, באמצעות שילוב של שיטות מוגדרות ומרומזות, כמו קבלת תחזיות אוטומטי (סינון) על האינטרסים של המשתמשים על ידי איסוף מידע או העדפות הטעם של משתמשים רבים (שיתוף פעולה). הנחת היסוד של גישת מערכות ההמלצה היא כי אלו שהסכימו בעבר נוטים להסכים שוב בעתיד, עם זאת יש לשים לב כי ההמלצות ניתנות לפי בחירות המשתמש היחיד אותו זיהתה המערכת והצליבה עם מידע קודם שהיה עליו ועם מידע אחר שהיה לה ממשתמשים שונים בעלי בחירות דומות.

להלן מספר דוגמאות לאיסוף נתונים מוגדרים:

  • לבקש מהמשתמש להעריך פריט מסוים באמצעות סולם נע.
  • לבקש מהמשתמש לדרג אוסף פריטים מהמועדף למועדף במידה פחותה יותר.
  • להציג שני פריטים ולבקש מהמשתמש לבחור את הפריט הטוב יותר.
  • לבקש מהמשתמש ליצור רשימת פריטים אהובים.

להלן מספר דוגמאות לאיסוף נתונים מרומזים:

  • לבחון פריטים שנבחנו על ידי המשתמש בחנות מקווננת.
  • לשמור רישום של פריטים שנקנו דרך האינטרנט.
  • להשיג רשימה של שירים שהושמעו במחשבו של המשתמש.

מערכת ההמלצה משווה את הנתונים שנאספו לנתונים של אנשים אחרים ומשתמשת בשני עקרונות בסיסיים המעורבים ביישום, ראשית בחוכמת ההמונים ובחוק המספרים הגדולים שניהם מראים כי ככל שהקהילות גדלות, אך לא רק אלא גם מגוונות, ועצמאיות לדוגמה, כך הקהילה יכולה לקבל החלטות טובות יותר מאשר קומץ העורכים, ולכן ככל שהקהילה תהיה גדולה יותר ההחלטות שלה עשויות להיות טובות יותר. עיקרון בסיסי שני הוא העיקרון השני מציע כי בכל קהילה גדולה, עם מספיק נתונים על המשתתפים בודדים, על איך משתתפים בודדים מתואמים או משתפים פעולה אחד עם השני, אנחנו יכולים לעשות תחזיות לגבי מה שהמשתמשים האלה יאהבו בעתיד על סמך הטעמים שלהם בעבר, כלומר לפתח מנועי המלצה מסוננים בשיתוף פעולה. זה, כמובן, מסתמך על העובדה כי האינטרסים של אנשים, העדפות אידאולוגיות אינם משתנים באופן דרסטי מדי לאורך זמן, ובהתאם לחשב את רשימת הפריטים מומלצים עבור המשתמש על בסיס עקרונות אלו.

מערכות המלצה מציעות למשתמש מוצרים או דפי אינטרנט שעשויים לעניין אותו, בהתבסס על מידע שהמערכת אספה על המשתמש ועל הפריטים ממחקר אשר נעשה על נושא המידע אשר נאסף על משתמש, על ידי מערכת המלצה שיתופית, עולה כי משתמשים אשר מחפשים מוצרים ברשת יעדיפו להתבסס יותר על "קבוצת חברים" מאשר על פני "קבוצת שכנים"[1], כאשר שכנים מוגדרים כמשתתפי קבוצת הממליצים שלהעדפותיהם המתאם הגבוה ביותר לאלו של מבקש ההמלצה, ואילו חברים מוגדרים כתת-קבוצה של שכנים המורכבת ממשתמשים הדומים למחפש ההמלצה, ראשית במאפייניהם האישיים ואחר כך גם בהעדפותיהם.

ישנן מספר סוגים של שיטות המלצה:

  1. מערכות מבוססות תוכן - מתבססות על תוכן דפי האינטרנט או תיאור הפריטים. המערכות בקטגוריה זו מתחלקות לשלושה סוגים, מבוססות על תוכן פרופיל משתמש ותיאור פריטים, מבוססות על נתוני פרופיל המשתמש (גיל, מיקום גאוגרפי ועוד) ומבוססות על היסטוריית הגלישה של המשתמש. מערכות המבוססות על תוכן פרופיל משתמש סוקרות פריטים שתוכנם מותאם לתוכן הקיים בפרופיל המשתמש. מערכות המבוססות על נתוני פרופיל המשתמש מתאימות מוצרים שעשויים להיות רלוונטיים למשתמש על פי נתונים כגון גיל או מיקום גאוגרפי. מערכות המבוססות על היסטוריית הגלישה של המשתמש עושות שימוש בשיטות של כריית נתונים מנתוני היסטוריית הגלישה של המשתמש ומזהות את תחומי העניין שלו.
  2. מערכות מבוססות משוב - מערכות אלו תלויות בשיתוף פעולה מצד המשתמש. קטגוריה זו מחולקת לשיטות המבוססות על דירוג פריטים ושיטות המבוססות על דירוג קשרים בין פריטים. במערכות המבוססות על דירוג פריטים המשתמש מדרג את דף האינטרנט או הפריט אותו הוא סוקר ובחירתו מצטרפת לדירוג של יתר המשתמשים. אחת הבעיות העיקריות בשיטה זו היא שלא ניתן להמליץ על פריטים חדשים שעדיין לא דורגו בידי מספיק אנשים. במערכות המבוססות על דירוג קשרים המשתמש מתבקש לציין פריטים קשורים לפריט אותו הוא סוקר וההמלצות ניתנות בהתאם לעוצמות הקשרים לפריטים אחרים. בעיה נוספת בשיטת המלצה זו היא היכולת של בעלי עניין להטעות את מערכת ההמלצה על ידי מתן דירוגים והמלצות פיקטיביות לפריט מסוים, בעקבות כך המערכת תמליץ על פריט זה במקרים רבים ללא הצדקה.
  3. מערכות משולבות - מערכות אלו משתמשות הן בשיטות מבוססות משוב מהמשתמשים והן בשיטות מבוססות תוכן, כך למשל כאשר מערכת משולבת ממליצה על סרט, היא תמליץ על סרט שהומלץ על ידי משתמשים אחרים וגם בעל תוכן המתאים למשתמש.

יתרונות וחסרונות של השיטות השונות

עריכה

מערכות מבוססות משוב נסמכות על מספר רב של משובים מהמשתמשים, אך למוצרים חדשים לא יהיו מספיק משובים ולכן קיים קושי להמליץ עליהם באמצעות מערכות אלו. בנוסף מערכות אלו תלויות מיסודן במשוב מהמשתמש, ולמידת שיתוף הפעולה של המשתמש עם המערכת חשיבות מכרעת על איכות ההמלצה שהוא ומשתמשים אחרים יקבלו. שימוש בקבלת משוב על סמך דירוג בסולם מוגדר ללא כתיבת טקסט עשוי להגדיל את מידת שיתוף הפעולה של המשתמשים ולאפשר למערכת לאסוף יותר משובים. היתרון הטמון בשיטה זו הוא שההמלצות מתקבלות ממשתמשים שבאמת התעניינו במוצרים. ההנחה היא שמשתמש שמתעניין למשל בקניית מסך מחשב, יבצע טרם הקנייה סקר מקיף ולאחר מכן יבצע את הרכישה וימליץ על המוצר אותו רכש, דבר המעלה את רמת האמינות של ההמלצה.

במערכות מבוססות תוכן לעומת זאת, נפתרת סוגיית ההמלצה על מוצרים חדשים כיוון שהתאמת תוכן לא מתייחסת למספר הממליצים האחרים. סוגיית התלות במשוב מן המשתמש עדיין קיימת באופן חלקי, שכן ככל שפרופיל המשתמש יכיל נתונים רבים ומדויקים יותר כך ההמלצה תהיה טובה יותר. סוגיה זו נפתרת אם פועלים בשיטה מבוססת היסטוריית גלישה, שבה המערכת אוספת נתונים ללא כל משוב מהמשתמש עצמו. אולם לשיטה מבוססת היסטוריית גלישה קיים חיסרון אחר, סביר להניח שבחיפושיו אחר פריט מסוים יגיע המשתמש לפריטים שאינם מעניינים אותו, אך למרות זאת הם יישמרו בהיסטוריית הגלישה שלו ופריטים אלו או דומים להם יומלצו לו בעתיד. כמו כן, קיימת אפשרות שמספר משתמשים צופים בפריטים מאותו מחשב וכך כל משתמש עלול לקבל המלצות מהיסטוריית הגלישה של משתמש אחר.

יתרונות וחסרונות

עריכה

יתרון בולט במערכת ההמלצה הוא נגישות למאגר מידע אדיר, האינטרנט. כמו כן, מערכת ההמלצה אובייקטיבית ואינה תלויה באחרים. עם זאת, ישנה אפשרות לשנות את תוצאות המערכת ממניעים פרסומיים, מצד משתמשי המערכת ומנהליה. חיסרון נוסף הוא שייחוס משקל יתר להמלצה ללא בסיס, יגרור תוצאות מוטעות.

כדי שמערכת המלצה תעבוד כראוי ובצורה מועילה, עליה להשתמש בנתונים רבים. היא מסתמכת על משתמשים שידרגו עם שיקול דעת ומכיוון שישנם מדרגים "לא רציניים", היא מקבלת מידע משובש. קיימת אף בעיה של אמינות וחוסר מוטיבציה לדרג מכיוון שחלק גדול מהמשתמשים אינו מעוניין להשקיע בדירוג.

הטיה ורמאות במערכות המלצה

עריכה

מערכות המלצה חשופות לסיכון של הטיה ורמאות.

  • התקפה גנרית בה תוכנה מתקשרת לאתר אינטרנט בהתחזות לאדם, ובכך מטה את הסטטיסטיקה.
  • התקפת בזבוז זמן על עיבוד מידע – המשתמש עלול לבזבז זמן כתוצאה מהתעניינות במוצרים שהומלצו על ידי המערכת למרות שאין לו עניין בהם.
  • התקפת אובדן מידע – כתוצאה מהטיה ורמייה של המשתמשים, המשתמש לא נחשף לכל פריטי המידע אותו הוא מחפש. לדוגמה משתמש המחפש מוצר מסוים יקבל באתר "משוחד" את רוב המוצרים של חברה ספציפית (Mobasher, Burke and Sandvig, 2006).

ביבליוגרפיה

עריכה
  1. Basu, C., Hirsh, H., & Cohen, W. (1998). Recommendation as classification: using social and content-based information in recommendation. In Proceedings of the 15th National conference on Artificial Intelligence (AAAI-98).
  2. Bueno, D., Conejo, R., & David, A. A. (2002). METIOREW: An Objective Oriented Content Based and Collaborative Recommending System. In S. Reich, M.M. Tzagarakis, P.M.E. De Bra (Eds.): OHS/SC/AH 2001, LNCS 2266, pp. 310-314, 2002.
  3. Felfernig, A., & Friedrich, G. (2007). Recommender Systems. IEEE Intelligent Systems. 1541-1672/07.
  4. Fu, X., Budzik, J., & Hammond, K. J. (2000). Mining navigation history for recommendation. In Proceedings of 2000 International Conference on Intelligent User Interfaces, New Orleans, LA, pp. 106-112.
  5. Resnick, P. and Varian, H. R.)1997). Recommender systems. Commun. ACM 40, pp. 56-58.
  6. Bamshad Mobasher and Robin Burke and JJ Sandvig (2006), "Model-Based Collaborative Filtering as a Defense Against Profile Injection Attacks", DePaul University, Chicago.

ראו גם

עריכה

קישורים חיצוניים

עריכה
  מדיה וקבצים בנושא מערכות המלצה בוויקישיתוף

הערות שוליים

עריכה
  1. ^ Dan-Gur. YM, "Choosing Recommenders: Controlled 'Friends Group' in Recommender Systems", 2005"