اعتراف‌گیری از هوش مصنوعی؛ OpenAI سیستم جدیدی برای شفاف‌سازی رفتار مدل‌ها معرفی کرد

2 هفته پیشآخرین به روز رسانی: 13/09/1404

0 1 خواندن این مطلب 1 دقیقه زمان میبرد

OpenAI درحال کار روی یک چارچوب جدید برای آموزش مدل‌های هوش مصنوعی است که هدف آن، ترغیب مدل‌ها به اعتراف صادقانه درباره رفتارهای نامطلوب خود است. این سیستم با تمرکز بر یکی از چالش‌های جدی مدل‌های زبانی، یعنی تمایل به ارائه پاسخ‌های مطلوب و بعضاً چاپلوسانه، تلاش می‌کند مدل را به ارائه توضیح دوم و مستقل درباره نحوه رسیدن به پاسخ اصلی وادار کند.

یکی از رفتارهای رایج در مدل‌های هوش مصنوعی امروزی چاپلوسی و ارائه پاسخ‌هایی است که بیش‌ازحد مطمئن هستند. همچنین برخی از مدل‌ها دچار Hallucination شده و پاسخ‌های نادرستی ارائه می‌کنند.

حالا OpenAI می‌گوید چارچوب جدید که از آن با عنوان سیستم اعتراف یاد شده، به‌طور خاص تنها بر صداقت تمرکز دارد و معیارهای متنوع دیگری مثل کمک‌رسانی، دقت یا تبعیت از دستور که معمولاً برای ارزیابی پاسخ اصلی به‌کار می‌روند در آن لحاظ نمی‌شود.

به‌گفته پژوهشگران OpenAI، هدف اصلی این است که مدل بتواند بدون ترس از جریمه، درباره چیزی که انجام داده شفاف باشد؛ حتی اگر رفتار انجام‌شده مشکل‌زا تلقی شود. OpenAI اعلام کرده:

«اگر مدل به‌صورت صادقانه اعتراف کند که مثلاً آزمونی را هک کرده، از دستوری سرپیچی کرده یا به‌طور عمدی عملکردش را پایین آورده، نه‌تنها جریمه نمی‌شود، بلکه پاداش بیشتری هم دریافت می‌کند.»

طبق توضیحات محققان این شرکت، چنین سیستمی می‌تواند شفافیت مدل‌های زبانی را به‌طور چشمگیری افزایش دهد و امکان نظارت دقیق‌تر بر رفتارهای پنهانی مدل (اتفاقاتی که در پس‌زمینه یک پاسخ رخ می‌دهد) را فراهم کند. OpenAI همچنین امیدوار است «سیستم اعتراف» به ابزار کارآمدی در نسل‌های بعدی مدل‌های زبانی تبدیل شود.

گزارش فنی کامل این پروژه نیز برای علاقه‌مندان منتشر شده است و می‌توانید آن را دریافت کنید.

2 هفته پیشآخرین به روز رسانی: 13/09/1404

0 1 خواندن این مطلب 1 دقیقه زمان میبرد

نمایش بیشتر

اعتراف‌گیری از هوش مصنوعی؛ OpenAI سیستم جدیدی برای شفاف‌سازی رفتار مدل‌ها معرفی کرد

مطالعه بعدی

پای گوشی‌های سامسونگ هم به پرونده قاچاق موبایل لوکس باز شد

اظهارات جالب یکی از مدیران انویدیا درباره هوش مصنوعی

وضعیت صادرکننده چک را پیش از دریافت آن استعلام کنید

اینتل جزئیات فنی پردازنده‌های سری Panther Lake را اعلام کرد؛ ۴۰ درصد کم‌مصر‌ف‌تر

هوش مصنوعی Luma Ray3 معرفی شد؛ اولین مدل ویدیوساز استدلال‌گر [تماشا کنید]

آیفون ۱۸ طراحی شفاف خواهد داشت؟ همه چیز درباره نسل بعدی آیفون

پای گوشی‌های سامسونگ هم به پرونده قاچاق موبایل لوکس باز شد

اظهارات جالب یکی از مدیران انویدیا درباره هوش مصنوعی

وضعیت صادرکننده چک را پیش از دریافت آن استعلام کنید

اینتل جزئیات فنی پردازنده‌های سری Panther Lake را اعلام کرد؛ ۴۰ درصد کم‌مصر‌ف‌تر

هوش مصنوعی Luma Ray3 معرفی شد؛ اولین مدل ویدیوساز استدلال‌گر [تماشا کنید]

آیفون ۱۸ طراحی شفاف خواهد داشت؟ همه چیز درباره نسل بعدی آیفون

دیدگاهتان را بنویسید لغو پاسخ

گلکسی زد فلیپ 7 FE با طراحی آشنا در رندرهای جدید ظاهر شد

عرضه قابلیت تولید تصویر ChatGPT برای کاربران رایگان با تأخیر همراه شد

کاربران آیفون حالا می‌توانند از واتسپ برای تماس و پیام استفاده کنند

مطالعه بعدی

پای گوشی‌های سامسونگ هم به پرونده قاچاق موبایل لوکس باز شد

اظهارات جالب یکی از مدیران انویدیا درباره هوش مصنوعی

وضعیت صادرکننده چک را پیش از دریافت آن استعلام کنید

اینتل جزئیات فنی پردازنده‌های سری Panther Lake را اعلام کرد؛ ۴۰ درصد کم‌مصر‌ف‌تر

هوش مصنوعی Luma Ray3 معرفی شد؛ اولین مدل ویدیوساز استدلال‌گر [تماشا کنید]

آیفون ۱۸ طراحی شفاف خواهد داشت؟ همه چیز درباره نسل بعدی آیفون