در انحراف قابل توجهی از شیوه های قبلی خود، OpenAI اعلام کرده است که دیگر از داده های مشتری ارسال شده از طریق API های خود برای آموزش مدل های زبان گسترده خود مانند GPT-4 استفاده نخواهد کرد.
این تغییر توسط سم آلتمن، مدیر عامل OpenAI، اخیراً تأیید شد مصاحبه با CNBC
رویکرد جدید OpenAI به داده های کاربر
تغییر سیاست OpenAI در 1 مارس 2023 اجرا شد، زمانی که این شرکت بی سر و صدا شرایط خدمات خود را به روز کرد تا این تعهد جدید به حریم خصوصی کاربر را منعکس کند.
آلتمن تصریح کرد: «مشتریان به وضوح میخواهند که ما بر اساس دادههای آنها آموزش ندهیم، بنابراین ما برنامههای خود را تغییر دادیم: ما این کار را انجام نخواهیم داد.»
API ها یا رابط های برنامه نویسی کاربردی، چارچوب های تکنولوژیکی هستند که به مشتریان اجازه می دهند مستقیماً به نرم افزار OpenAI متصل شوند.
آلتمن اظهار داشت که OpenAI برای مدتی از دادههای API برای آموزش مدل استفاده نمیکند، و این نشان میدهد که این اعلامیه رسمی یک عمل موجود را رسمی میکند.
پیامدها برای مشتریان تجاری
حرکت OpenAI پیامدهای گسترده ای دارد، به ویژه برای مشتریان تجاری آن، که شامل غول هایی مانند مایکروسافت، Salesforce و Snapchat می شود.
این شرکتها به احتمال زیاد از قابلیتهای API OpenAI برای عملیات خود استفاده میکنند، بنابراین تغییر حریم خصوصی و حفاظت از دادهها به ویژه به آنها مربوط میشود.
با این حال، اقدامات جدید حفاظت از داده ها فقط برای مشتریانی که از خدمات API شرکت استفاده می کنند اعمال می شود. شرایط خدمات به روز شده OpenAI، “ما ممکن است از محتوای خدماتی غیر از API خود استفاده کنیم.”
به این ترتیب، سایر اشکال ورودی داده، مانند متن وارد شده به ربات چت محبوب ChatGPT، همچنان ممکن است توسط OpenAI مورد استفاده قرار گیرد، مگر اینکه داده ها از طریق API به اشتراک گذاشته شوند.
تأثیر گسترده تر صنعت
تغییر سیاست OpenAI زمانی اتفاق میافتد که صنایع با تأثیرات بالقوه مدلهای زبانی بزرگ، مانند ChatGPT OpenAI دستوپنجه نرم میکنند، که جایگزین موادی است که بهطور سنتی توسط انسانها ایجاد میشود.
به عنوان مثال، انجمن نویسندگان آمریکا اخیراً پس از شکست مذاکرات بین انجمن صنفی و استودیوهای فیلم، دست به اعتصاب زد. انجمن از محدودیتهایی در استفاده از ChatGPT OpenAI برای تولید یا بازنویسی اسکریپت حمایت میکرد.
تصمیم OpenAI برای استفاده نکردن از دادههای مشتری برای آموزش، لحظهای مهم در گفتگوی جاری درباره حریم خصوصی دادهها و هوش مصنوعی است. از آنجایی که شرکتها به کاوش و جابجایی مرزهای فناوری هوش مصنوعی ادامه میدهند، اطمینان از حفظ حریم خصوصی کاربر و حفظ اعتماد احتمالاً در این بحثها محور باقی خواهد ماند.
تکامل ChatGPT: GPT-3 به GPT-4
توجه به این نکته مهم است که تعهد OpenAI به عدم استفاده از دادههای مشتری برای آموزش در مورد آخرین مدل زبان آن، GPT-4 که در 14 مارس 2023 منتشر شد، اعمال میشود.
GPT-4 چندین پیشرفت را نسبت به نسل قبلی خود، GPT-3 معرفی کرد، از جمله افزایش قابل توجه در اندازه محدودیت کلمات (25000 در مقایسه با محدودیت 3000 کلمه ChatGPT)، اندازه پنجره زمینه بیشتر، و توانایی های استدلال و درک بهبود یافته.
یکی دیگر از ویژگی های قابل توجه GPT-4، چند وجهی بودن آن یا توانایی درک و استنتاج اطلاعات از تصاویر علاوه بر متن است. این جدیدترین مدل با استفاده از ویژگیهایی مانند ایموجی برای احساس شخصیتر، متنهای شبیه به انسان بیشتری تولید میکند.
با این حال، اندازه و معماری دقیق GPT-4 فاش نشده است، که منجر به گمانه زنی در مورد جزئیات مدل می شود.
با وجود این شایعات، مدیر عامل OpenAI ادعاهای خاص در مورد اندازه مدل را رد کرده است.
در مورد عملکرد، GPT-4 دارد نقاط قوت را نشان داد در تولید متن بلکه برخی محدودیت ها نیز وجود دارد. به عنوان مثال، آن را در صدک 54 در نوشتن آزمون فارغ التحصیل رکورد (GRE) و در صدک 43 – 59 در آزمون AP حساب دیفرانسیل و انتگرال BC انجام شد.
علاوه بر این، در وظایف آسان کدگذاری Leetcode عملکرد خوبی داشت، اما با افزایش سختی کار، عملکرد آن کاهش یافت.
در حالی که مشخصات فرآیند آموزشی GPT-4 به طور رسمی مستند نشده است، مشخص است که مدلهای GPT عموماً شامل یادگیری ماشینی در مقیاس بزرگ با طیف متنوعی از متنهای اینترنتی هستند.
مشتاقانه منتظر است
در نتیجه تغییرات در خطمشی استفاده از داده OpenAI، دادههای مورد استفاده برای آموزش مدلهای زبان آن شامل اطلاعات به اشتراکگذاشتهشده از طریق API نمیشود، مگر اینکه کاربران صریحاً موافقت کنند که آن را برای این منظور مشارکت دهند.
در حالی که این فناوری بهبود مییابد و نقش مهمی در زندگی ما ایفا میکند، جالب است که چگونه شرکتها به نگرانیهای مربوط به خصوصی نگهداشتن دادهها و جلب اعتماد مردم واکنش نشان میدهند.
تصویر ویژه ایجاد شده توسط نویسنده با استفاده از Midjourney.
منبع: https://www.searchenginejournal.com/openais-u-turn-not-training-gpt-4-on-api-customer-data/486330/