مطالعه نشان می دهد که طنز ChatGPT هنوز کاملاً انسانی نیست


ChatGPT به دلیل توانایی خود در تولید متنی که منعکس کننده مکالمات انسانی است، شناخته شده است و آن را به ابزاری گسترده برای صنایع مختلف از جمله بازاریابی دیجیتال تبدیل می کند.

با این حال، اخیر مطالعه توانایی مدل برای تولید و درک شوخ طبعی را زیر سوال می برد، که جزء کلیدی در تعامل و ارتباط با مخاطبان است.

تحقیقات انجام شده توسط محققان آلمانی سوفی جنتزش و کریستین کرستینگ نشان می دهد که اگرچه ChatGPT در برخی زمینه ها برتر است، اما محدودیت های قابل توجهی در تولید طنز اصلی دارد.

خنده بازیافتی: مسئله اصالت

مطالعه ای که توسط دانشگاه کرنل انجام شده است با هدف پاسخ به این سوال: “مدل هوش مصنوعی چگونه طنز را مدیریت می کند؟”

محققان اصالت طنز تولید شده توسط هوش مصنوعی، توانایی ChatGPT در درک و توضیح جوک ها و مهارت آن در تشخیص طنز را بررسی می کنند.

تیم تحقیقاتی در گزارش خود (تاکید از من) می‌گوید:

ما کشف کردیم که بیش از 90% از نمونه های تولید شده بودند همان 25 جوک. این تکرار نشان می‌دهد که این جوک‌ها در اصل ایجاد نشده‌اند، بلکه به صراحت از آموزش مدل یاد گرفته شده و به خاطر سپرده شده‌اند.»

محققان به این نتیجه رسیدند که این پاسخ‌ها احتمالاً در طول آموزش مدل هوش مصنوعی یاد گرفته و به خاطر سپرده شده‌اند، که نشان‌دهنده محدودیت در توانایی مدل برای تولید طنز اصلی است.

در گزارشی، محققان 10 جوک پرتکرار را که شامل آثار کلاسیکی مانند «چرا مترسک جایزه گرفت؟ زیرا او در رشته خود برجسته بود.»

این مطالعه علاوه بر آشکار کردن روش پیچیده ای که هوش مصنوعی با طنز مدیریت می کند، به عنوان یک هشدار برای افرادی است که امیدوارند از ChatGPT برای ایجاد محتوا با یک چرخش طنز استفاده کنند.

مفهوم بازاریابان دیجیتال که برای تولید محتوا به هوش مصنوعی تکیه می‌کنند واضح است – در حالی که مدل‌های هوش مصنوعی مانند ChatGPT می‌توانند الگوهای از پیش آموخته‌شده را برای ایجاد جوک تکرار کنند، اما اصالت وجود ندارد.

با وجود تکرار، تعداد کمی از پاسخ های تولید شده منحصر به فرد بودند. با این حال، این تا حد زیادی با ترکیب عناصر از جوک های مختلف شناخته شده ایجاد شد و همیشه منطقی نبود.

توضیح جوک: فراتر از طنز سطحی

این مطالعه بیشتر ظرفیت ChatGPT را برای توضیح طنز مورد بررسی قرار داد که نیاز به درک عمیق‌تری از ساختار و مفاهیم جوک داشت.

در حالی که این مدل می‌توانست عناصر سبکی مانند شخصیت‌پردازی‌ها و بازی کلمات را تجزیه و توضیح دهد، در مواجهه با جوک‌های غیرمتعارف محدودیت‌هایی را نشان داد.

تیم مشاهده کرد:

«ChatGPT تلاش می‌کند تا توالی‌هایی را توضیح دهد که با الگوهای آموخته‌شده مطابقت ندارند. زمانی که چیزی خنده دار نیست یا فاقد توضیح معتبر است، نشان نمی دهد.»

در مواردی که ChatGPT نمی‌توانست جوک‌های غیر خنده‌دار را شناسایی کند، توضیحات قابل قبولی می‌دهد.

برای بازاریاب هایی که به دنبال جذب مخاطبان خود از طریق طنز ظریف هستند، اتکای صرف به هوش مصنوعی ممکن است نتایج مطلوبی را به همراه نداشته باشد.

تشخیص شوخی: رمزگشایی خط پانچ

فراتر از تولید و توضیح جوک، تیم تحقیقاتی توانایی ChatGPT را در تشخیص طنز آزمایش کردند.

آنها دریافتند که در حالی که این مدل می‌تواند جوک‌ها را بر اساس ساختار، بازی کلمات و موضوع به درستی شناسایی کند، اما اگر جمله‌ای فقط یکی از این ویژگی‌ها را داشته باشد، نتوانست جمله‌ای را به عنوان جوک طبقه‌بندی کند.

این امر بر اتکای مدل به الگوهای آموخته شده و عدم درک جامع تر از طنز تأکید می کند.

این برای بازاریابان چه معنایی دارد؟

در حالی که ChatGPT انقلابی در قلمرو محتوای تولید شده توسط هوش مصنوعی ایجاد کرده است، این تحقیق هنگام تکیه بر مدل تولید طنز احتیاط را توصیه می کند.

این مطالعه نتیجه می گیرد:

اگرچه شوخی‌های ChatGPT جدیداً تولید نشده‌اند، اما این لزوماً توانایی‌های سیستم را از بین نمی‌برد… با این حال، این که آیا یک عامل مصنوعی قادر به درک آنچه آموخته است یا خیر، یک سوال فوق‌العاده سخت است.

از آنجایی که بازاریابان دیجیتال برای تنوع بخشیدن و گسترش محتوای خود به هوش مصنوعی نگاه می کنند، درک محدودیت ها و نقاط قوت مدل ضروری است. در حوزه طنز، حداقل در حال حاضر، خلاقیت انسان غیرقابل جایگزین است.

این تیم تحقیقاتی قصد دارد تحقیقات مشابهی را روی مدل‌های جدید هوش مصنوعی مانند LLaMa و GPT-NeoX انجام دهد که نویدبخش بینش‌های بیشتر در مورد دنیای طنز محاسباتی است.


تصویر ویژه ایجاد شده توسط نویسنده با استفاده از Midjourney.
منبع: https://www.searchenginejournal.com/chatgpts-humor-isnt-quite-human-yet-study-finds/488962/