جستجوی ChatGPT نرخ خطای 76.5% را در مطالعه اسناد نشان می دهد


به گفته a. جستجوی ChatGPT OpenAI برای استناد دقیق ناشران اخبار مشکل دارد مطالعه کنید توسط مرکز یدک کشی برای روزنامه نگاری دیجیتال دانشگاه کلمبیا.

این گزارش نقل قول‌های اشتباه مکرر و اسناد نادرست را نشان می‌دهد که نگرانی‌هایی را در میان ناشران در مورد دیده شدن برند و کنترل بر محتوای آنها ایجاد کرده است.

علاوه بر این، یافته ها تعهد OpenAI به توسعه هوش مصنوعی مسئولانه در روزنامه نگاری را به چالش می کشد.

پس زمینه در جستجوی ChatGPT

OpenAI ماه گذشته ChatGPT Search را راه‌اندازی کرد و ادعا کرد که همکاری گسترده‌ای با صنعت اخبار داشته و بازخورد ناشران را در خود جای داده است.

این در تضاد با عرضه اولیه ChatGPT در سال 2022 است، جایی که ناشران متوجه شدند که محتوای آنها برای آموزش مدل‌های هوش مصنوعی بدون اطلاع یا رضایت استفاده شده است.

اکنون، OpenAI به ناشران اجازه می دهد تا از طریق فایل robots.txt مشخص کنند که آیا می خواهند در نتایج جستجوی ChatGPT گنجانده شوند یا خیر.

با این حال، یافته‌های مرکز یدک کشی نشان می‌دهد که ناشران بدون توجه به انتخاب مشارکت خود، با خطر توزیع نادرست و ارائه نادرست مواجه هستند.

مسائل مربوط به دقت

مرکز یدک کش توانایی ChatGPT Search را برای شناسایی منابع نقل قول از 20 نشریه ارزیابی کرد.

یافته های کلیدی عبارتند از:

  • از 200 پرسش، 153 پاسخ نادرست بود.
  • هوش مصنوعی به ندرت اشتباهات خود را تصدیق می کرد.
  • عباراتی مانند “احتمالا” تنها در هفت پاسخ استفاده شد.

ChatGPT اغلب رضایت کاربران را بر دقت اولویت قرار می دهد، که می تواند خوانندگان را گمراه کند و به شهرت ناشر آسیب برساند.

علاوه بر این، محققان دریافتند که جستجوی ChatGPT زمانی که چندین بار از یک سوال پرسیده می‌شود ناسازگار است، احتمالاً به دلیل تصادفی بودن مدل زبان آن.

استناد به محتوای کپی شده و همزمان

محققان دریافتند که ChatGPT Search گاهی اوقات به جای منابع اصلی به مقالات کپی شده یا همبسته شده استناد می کند.

این احتمالاً به دلیل محدودیت های ناشر یا محدودیت های سیستم است.

به عنوان مثال، هنگامی که از یک مقاله نیویورک تایمز درخواست شد (در حال حاضر درگیر شکایت علیه OpenAI و مسدود کردن خزنده‌های آن است)، ChatGPT به یک نسخه غیرمجاز در سایت دیگری پیوند داده شد.

حتی با بررسی فناوری MIT، که به خزنده‌های OpenAI اجازه می‌دهد، ربات چت به جای نسخه اصلی، یک کپی سندیکایی را ذکر کرد.

مرکز یدک کشی دریافت که همه ناشران در خطر ارائه نادرست توسط ChatGPT Search هستند:

  • فعال کردن خزنده ها قابلیت مشاهده را تضمین نمی کند.
  • مسدود کردن خزنده ها مانع از نمایش محتوا نمی شود.

این مسائل نگرانی‌هایی را در مورد فیلتر کردن محتوای OpenAI و رویکرد آن به روزنامه‌نگاری ایجاد می‌کند که ممکن است مردم را از ناشران اصلی دور کند.

پاسخ OpenAI

OpenAI به یافته‌های مرکز یدک‌کشی پاسخ داد و بیان کرد که از ناشران از طریق ذکر منبع واضح پشتیبانی می‌کند و به کاربران کمک می‌کند محتوا را با خلاصه‌ها، نقل قول‌ها و پیوندها کشف کنند.

یک سخنگوی OpenAI بیان کرد:

«ما با کمک به ۲۵۰ میلیون کاربر هفتگی ChatGPT در کشف محتوای باکیفیت از طریق خلاصه‌ها، نقل‌قول‌ها، پیوندهای واضح و ذکر منبع، از ناشران و سازندگان حمایت می‌کنیم. ما با شرکا همکاری کرده‌ایم تا دقت استناد درون خطی را بهبود بخشیم و به اولویت‌های ناشر احترام بگذاریم، از جمله فعال کردن نحوه نمایش آنها در جستجو با مدیریت OAI-SearchBot در robots.txt. ما به بهبود نتایج جستجو ادامه خواهیم داد.”

در حالی که این شرکت برای بهبود دقت استناد کار کرده است، OpenAI می‌گوید پرداختن به مسائل مربوط به نادرستی خاص دشوار است.

OpenAI همچنان متعهد به بهبود محصول جستجوی خود است.

نگاه کردن به جلو

اگر OpenAI می‌خواهد با صنعت خبر همکاری کند، باید اطمینان حاصل کند که محتوای ناشر به طور دقیق در جستجوی ChatGPT نشان داده می‌شود.

ناشران در حال حاضر قدرت محدودی دارند و از نزدیک پرونده های حقوقی علیه OpenAI را زیر نظر دارند. نتایج می تواند بر حقوق استفاده از محتوا تأثیر بگذارد و به ناشران کنترل بیشتری بدهد.

همانطور که محصولات جستجوی مولد مانند ChatGPT نحوه تعامل مردم با اخبار را تغییر می‌دهند، OpenAI باید تعهد خود را به روزنامه‌نگاری مسئولانه نشان دهد تا اعتماد کاربران را جلب کند.


تصویر ویژه: رابرت وی/شاتراستاک


منبع: https://www.searchenginejournal.com/chatgpt-search-shows-76-5-error-rate-in-attribution-study/533978/