عدم آموزش GPT-4 در مورد داده های مشتری API


در انحراف قابل توجهی از شیوه های قبلی خود، OpenAI اعلام کرده است که دیگر از داده های مشتری ارسال شده از طریق API های خود برای آموزش مدل های زبان گسترده خود مانند GPT-4 استفاده نخواهد کرد.

این تغییر توسط سم آلتمن، مدیر عامل OpenAI، اخیراً تأیید شد مصاحبه با CNBC

رویکرد جدید OpenAI به داده های کاربر

تغییر سیاست OpenAI در 1 مارس 2023 اجرا شد، زمانی که این شرکت بی سر و صدا شرایط خدمات خود را به روز کرد تا این تعهد جدید به حریم خصوصی کاربر را منعکس کند.

آلتمن تصریح کرد: «مشتریان به وضوح می‌خواهند که ما بر اساس داده‌های آنها آموزش ندهیم، بنابراین ما برنامه‌های خود را تغییر دادیم: ما این کار را انجام نخواهیم داد.»

API ها یا رابط های برنامه نویسی کاربردی، چارچوب های تکنولوژیکی هستند که به مشتریان اجازه می دهند مستقیماً به نرم افزار OpenAI متصل شوند.

آلتمن اظهار داشت که OpenAI برای مدتی از داده‌های API برای آموزش مدل استفاده نمی‌کند، و این نشان می‌دهد که این اعلامیه رسمی یک عمل موجود را رسمی می‌کند.

پیامدها برای مشتریان تجاری

حرکت OpenAI پیامدهای گسترده ای دارد، به ویژه برای مشتریان تجاری آن، که شامل غول هایی مانند مایکروسافت، Salesforce و Snapchat می شود.

این شرکت‌ها به احتمال زیاد از قابلیت‌های API OpenAI برای عملیات خود استفاده می‌کنند، بنابراین تغییر حریم خصوصی و حفاظت از داده‌ها به ویژه به آنها مربوط می‌شود.

با این حال، اقدامات جدید حفاظت از داده ها فقط برای مشتریانی که از خدمات API شرکت استفاده می کنند اعمال می شود. شرایط خدمات به روز شده OpenAI، “ما ممکن است از محتوای خدماتی غیر از API خود استفاده کنیم.”

به این ترتیب، سایر اشکال ورودی داده، مانند متن وارد شده به ربات چت محبوب ChatGPT، همچنان ممکن است توسط OpenAI مورد استفاده قرار گیرد، مگر اینکه داده ها از طریق API به اشتراک گذاشته شوند.

تأثیر گسترده تر صنعت

تغییر سیاست OpenAI زمانی اتفاق می‌افتد که صنایع با تأثیرات بالقوه مدل‌های زبانی بزرگ، مانند ChatGPT OpenAI دست‌وپنجه نرم می‌کنند، که جایگزین موادی است که به‌طور سنتی توسط انسان‌ها ایجاد می‌شود.

به عنوان مثال، انجمن نویسندگان آمریکا اخیراً پس از شکست مذاکرات بین انجمن صنفی و استودیوهای فیلم، دست به اعتصاب زد. انجمن از محدودیت‌هایی در استفاده از ChatGPT OpenAI برای تولید یا بازنویسی اسکریپت حمایت می‌کرد.

تصمیم OpenAI برای استفاده نکردن از داده‌های مشتری برای آموزش، لحظه‌ای مهم در گفتگوی جاری درباره حریم خصوصی داده‌ها و هوش مصنوعی است. از آنجایی که شرکت‌ها به کاوش و جابجایی مرزهای فناوری هوش مصنوعی ادامه می‌دهند، اطمینان از حفظ حریم خصوصی کاربر و حفظ اعتماد احتمالاً در این بحث‌ها محور باقی خواهد ماند.

تکامل ChatGPT: GPT-3 به GPT-4

توجه به این نکته مهم است که تعهد OpenAI به عدم استفاده از داده‌های مشتری برای آموزش در مورد آخرین مدل زبان آن، GPT-4 که ​​در 14 مارس 2023 منتشر شد، اعمال می‌شود.

GPT-4 چندین پیشرفت را نسبت به نسل قبلی خود، GPT-3 معرفی کرد، از جمله افزایش قابل توجه در اندازه محدودیت کلمات (25000 در مقایسه با محدودیت 3000 کلمه ChatGPT)، اندازه پنجره زمینه بیشتر، و توانایی های استدلال و درک بهبود یافته.

یکی دیگر از ویژگی های قابل توجه GPT-4، چند وجهی بودن آن یا توانایی درک و استنتاج اطلاعات از تصاویر علاوه بر متن است. این جدیدترین مدل با استفاده از ویژگی‌هایی مانند ایموجی برای احساس شخصی‌تر، متن‌های شبیه به انسان بیشتری تولید می‌کند.

با این حال، اندازه و معماری دقیق GPT-4 فاش نشده است، که منجر به گمانه زنی در مورد جزئیات مدل می شود.

با وجود این شایعات، مدیر عامل OpenAI ادعاهای خاص در مورد اندازه مدل را رد کرده است.

در مورد عملکرد، GPT-4 دارد نقاط قوت را نشان داد در تولید متن بلکه برخی محدودیت ها نیز وجود دارد. به عنوان مثال، آن را در صدک 54 در نوشتن آزمون فارغ التحصیل رکورد (GRE) و در صدک 43 – 59 در آزمون AP حساب دیفرانسیل و انتگرال BC انجام شد.

علاوه بر این، در وظایف آسان کدگذاری Leetcode عملکرد خوبی داشت، اما با افزایش سختی کار، عملکرد آن کاهش یافت.

در حالی که مشخصات فرآیند آموزشی GPT-4 به طور رسمی مستند نشده است، مشخص است که مدل‌های GPT عموماً شامل یادگیری ماشینی در مقیاس بزرگ با طیف متنوعی از متن‌های اینترنتی هستند.

مشتاقانه منتظر است

در نتیجه تغییرات در خط‌مشی استفاده از داده OpenAI، داده‌های مورد استفاده برای آموزش مدل‌های زبان آن شامل اطلاعات به اشتراک‌گذاشته‌شده از طریق API نمی‌شود، مگر اینکه کاربران صریحاً موافقت کنند که آن را برای این منظور مشارکت دهند.

در حالی که این فناوری بهبود می‌یابد و نقش مهمی در زندگی ما ایفا می‌کند، جالب است که چگونه شرکت‌ها به نگرانی‌های مربوط به خصوصی نگه‌داشتن داده‌ها و جلب اعتماد مردم واکنش نشان می‌دهند.


تصویر ویژه ایجاد شده توسط نویسنده با استفاده از Midjourney.




منبع: https://www.searchenginejournal.com/openais-u-turn-not-training-gpt-4-on-api-customer-data/486330/