והרי החדשות, שלקחנו מאיפשהו

מהם האתרים האהובים על צ׳אט ג׳יפיטי, האם הם שונים מאלה של גוגל - ועד כמה למשתמשים אכפת מאיפה כל התשובות האלה הגיעו?

בתוך הוויכוח הסוער שמתקיים כרגע בין גופי עיתונות וענקיות הטכנולוגיה, יש נושא אחד שקצת הלך לאיבוד. רוב הוויכוח מדבר על זכויות יוצרים מצד אחד, ופגיעה עסקית בצד השני. כלומר, יש פה שתי שאלות עיקריות: האם זה לגיטימי שגוגל, OpenAI, Perplexity וכו׳ ישתמשו בתוכן שמייצרים אתרי חדשות במסגרת תשובות מבוססות AI, והאם השימוש שלהן בתוכן הזה למעשה בא על חשבון ההצלחה העסקית של אותם אתרים בכך שהוא מייתר את הפנייה למקור? 

עד עכשיו, לא נראה שיש הכרעה ברורה לגבי שתי השאלות. השאלה משפטית עדיין מתנהלת במסגרת תביעות קיימות (ועוד על כך בשבוע הבא). השאלה העסקית גם היא עדיין פתוחה: יש מחקרים וניתוחים שמראים ירידה דרמטית בהקלקות, אבל ישנן גם טענות שהמגמה הזאת מינורית אם בכלל מורגשת (התייחסתי לזה בין היתר כאן וכאן).  אבל בשתיהן, נדמה שאנחנו מתייחסים לסוגייה הזו ככזו שיש בה רק שני צדדים – כשבפועל, יש כאן שחקן נוסף: הצרכן. 

אז הנה שני מחקרים שמנסים לענות גם על זה (כאן וכאן): שניהם מציעים ניתוח של יותר מ-24 אלף שאילתות ותשובות מאתר LMArena, והאינטראקציה של המשתמשים איתן. חשוב לציין, יש במחקרים האלה לא מעט תובנות מעניינות מבחינת גופי חדשות, עוד לפני שאנחנו מגיעים לחוויה של המשתמשים – ואגע בהן. למשל, ניתן לראות שם את ההבדלים בין המודלים השונים מבחינת העדפת מקורות חדשותיים, איכות המקורות האלה ומידת הגיוון שלהם (דברים שבחלקם הזכרתי כבר בעבר, בהקשר של גוגל – כאן). 

אבל היתרון הגדול של המחקרים האלה על ניתוחים דומים קודמים הוא שהפעם, אפשר להעריך לא רק את התשובות שמספקים המודלים – אלא גם את חוות הדעת של השואלים. הדבר מתאפשר בזכות הפלטפורמה הייחודית של LMArena: זהו אתר שבעצם מאפשר למשתמשים להשתתף במלאכת הדירוג של מודלי שפה גדולים – בכך שהם מקבלים תשובות משני מודלים שונים, ואז מתבקשים להכריע מי מהם עמד במשימה טוב יותר. האתר מציע גם מצעד מתעדכן של מודלים בחלוקה לקטגוריות שונות.

ההשוואות התמקדה בעיקר בשלושה מודלים – או ליתר דיוק, שלוש משפחות מודלים: גוגל, OpenAI ו-Perplexity – ומצאה כמה הבדלים משמעותיים באופן שבו הם משלבים מקורות חדשותיים:

  • פער גדול בשכיחות הופעתם של מקורות חדשותיים: ChatGPT, מתברר, מאוד אוהב להסתמך על אתרי חדשות. יותר מ-19% מהמקורות אליהם הוא מתייחס בתשובות הם חדשותיים – בעוד שאצל גוגל ו-Perplexity מדובר בפחות מ-8%. 
     
  • לכל אחד מהמודלים ישנם ״האתרים האהובים עליו״: ChatGPT מעדיף לבסס את התשובות שלו על סוכנויות ידיעות (רויטרס ו-AP). המנוע של Perplexity מדגיש את BBC ויאהו, ובגוגל בכלל מעדיפים את Indiatimes – מה שמעלה את החשד שהוא מושפע יותר מאופטימיזציית תוכן.
     
  • גם מידת הגיוון של המקורות שונה מאוד. ב-Perplexity, עשרים המקורות המובילים מהווים 28.5% מכלל המקורות החדשותיים. המצב די דומה בגוגל (31.9%). ב-ChatGPT לעומת זאת, שני המקומות הראשונים לבדם מהווים 35% – ועשרים המקומות הראשונים מהווים יותר מ-67%. 
     
  • הניתוח כולל גם בחינה של איכות המקורות, וההטייה הפוליטית שלהם. לא אצלול כאן לאופן שבו הם הגדירו איכות גבוהה/נמוכה, או הטייה פוליטית (שזה אפילו יותר מורכב), אבל אפשר לזהות שם מגמות יחסית ברורות – כל המודלים מסתמכים בשכיחות גבוהה על מקורות איכותיים, ולכולם יש הטייה ליברלית מסוימת (אילון מאסק צדק?!). 
     
  • וכאן אנחנו מגיעים להעדפות המשתמשים (וזה גם המקום שבו הניתוחים מציעים הסתכלות שונה). הניתוח הראשון מעלה שמה שבאמת חשוב להם, זה מספר המקורות ואורך התשובה. למעשה, מספר המקורות משפיע על הערכת המשתמש גם כשהם לא תומכים באופן ישיר בתשובה המוצגת. 
     
  • בניתוח השני, המסקנה מעט שונה: אורך התשובה אכן משפיע דרמטית, אבל מספר המקורות דווקא לא – לפחות כשמשווים תשובות ששילבו לפחות מקור אחד. מצד שני, גם שכיחותם של מקורות חדשותיים, איכותם וההטייה הפוליטית שלהם, כמעט ולא השפיעו על ההערכה שסיפקו המשתמשים.

 

המסקנות כאן אולי שונות מעט, אבל השורה התחתונה שלהן מעניינת: המשתמשים במודלים השונים מתייחסים למקורות שמאחורי התשובות באופן שטחי למדי. הם לא מוטרדים מפרמטרים של איכות, הטייה פוליטית או אפילו קשר ישיר לתשובה שסופקה להם, ולא בהכרח מחפשים שם מותגי חדשות מוכרים – אלא בעיקר רוצים לראות תשובה ״מושקעת״, שמשלבת כמה מקורות. ממש כמו באקדמיה!

כדי לא להשאיר אתכם עם התחושה העגומה שאנחנו בדרך לעולם שבו אנשים יצרכו חדשות רק דרך מודלים ויפתחו אפתיות מוחלטת כלפי המקורות שמזינים אותם, אסיים עם מחקר שונה לגמרי, שמציע אפשרות אלטרנטיבית. כאן, קבוצה של חוקרים ניסתה ללכת בכיוון ההפוך ולשאול את השאלה – האם חשיפה מודעת לכך שבעידן הבינה המלאכותית קשה יותר לדעת מה אמיתי ומה לא, תגרום לאנשים להעריך באופן שונה גופי חדשות? 

זה מחקר מאוד ראשוני, ומאוד מצומצם בהיקף שלו, אבל הקונספט עצמו מעניין: מבקרים באתר חדשות גרמני (Süddeutsche Zeitung) התבקשו לענות על שאלון שנוגע לאמון שלהם ברשתות חברתיות ובגופי חדשות, ואז הוצגו בפניהם שלושה זוגות של תמונות, והם נדרשו להכריע אם הן נוצרו באמצעות AI (המבחן היה קשה במיוחד: רק 2% קלעו בשלוש השאלות, ויותר משליש טעו בכולן). 

מה שעניין במיוחד את החוקרים היה התנהגות המשתמשים לאחר החשיפה המודעת למניפולציות האלה – והיא אכן מעודדת: משתמשים שנחשפו למבחן ביקרו באתר בתדירות גבוהה יותר לאחר מכן, ובקרב מנויים משלמים שנחשפו אליו – שיעור הנטישה היה נמוך יותר מהמגמה הכללית. 

כמובן, יש לא מעט מגבלות במחקר הזה: הוא מלכתחילה פונה לקוראים של גוף עיתונות מוערך, ולא לאנשים שרוב צריכת התוכן שלהם נעשית בסושיאל; ומדובר רק בכלי תקשורת אחד, במדינה אחת, רובם בטווח גילאים ספציפי (60-40) ובמספרים קטנים יחסית (אלפי משתמשים). מצד שני, יש פה רציונל מסוים שאפשר להבין – ושיש לו עדויות תומכות מהעבר: כשאנשים נחשפים למניפולציות, ומודעים לעובדה שמניפולציות כאלה קיימות סביבם, הם נוטים להיאחז במקורות שהם תופסים כאמינים יותר. 

דוגמה מאוד בולטת מהשנים האחרונות היא ה-COVID bump: כשאנשים הרגישו חסרי אונים, שרמת האי-ודאות סביבם גבוהה מאוד וכמות המיסאינפורמציה גבוהה בהתאם – האמון הציבורי בעיתונות עלה משמעותית, אחרי שנים של ירידה מתמשכת. הקפיצה הזו לא החזיקה מעמד לאורך זמן, ממש כמו הסגרים והמסכות. מצד שני, מניפולציות מבוססות AI לא הולכות לשום מקום – והקונטקסט הזה עשוי לאפשר לגופי עיתונות לחזק את המעמד הציבורי שלהם, ולבסס את הערך שהם מציעים לקהל שלהם. 

לפחות הקהל שלא מסתכל רק על אורך התשובה.

המלצות

לאן נעלמו הפודקאסטים הנרטיביים? לפני עשור, ואפילו לפני חמש שנים, גופי עיתונות הקימו (או רכשו) פודקאסטים מושקעים מאוד, עם עריכה מוקפדת ומבנה עלילתי מדויק. אבל היום, מדובר בזן נכחד – זאת למרות שבאופן כללי, צריכת פודקאסטים רק עולה והבחירות האחרונות בארה״ב המחישו את חשיבותה של התעשייה הזו בעיצוב סדר היום הציבורי. הכתבה המעולה הזו של ״רולינג סטון״ מתחקה אחר עלייתו ונפילתו של הז׳אנר.

והנה פודקאסט לא נרטיבי ששווה האזנה: יצא לי להזכיר כאן כבר כמה פעמים בעבר את הנרי בלודג׳ט, מייסד ״ביזנס אינסיידר״ שהשיק לא מזמן מיזם עיתונאי בסאבסטאק. עכשיו יש לו גם פודקאסט חדש – Solutions (אפלספוטיפיי) – ולרגל השקתו הוא גם התראיין אצל פיטר קפקא ב-Channels (אפלספוטיפיי). תמיד מעניין לשמוע איך הוא תופס את עתיד העיתונות – ולמה הוא עדיין מאוד אופטימי.