مطالعه جدید: درخواست پاسخ کوتاه، دقت چتباتها را کاهش میدهد

نتایج یک مطالعه جدید نشان میدهد که تأکید بر پاسخهای مختصر ممکن است دقت مدلهای هوش مصنوعی در ارائه اطلاعات را کاهش دهد.
بر اساس گزارشی از شرکت فرانسوی Giskard، زمانی که از چتباتهای هوش مصنوعی درخواست میکنید پاسخهای کوتاهی ارائه کنند، احتمال «هذیانگویی» یا ارائه اطلاعات نادرست توسط آنها افزایش پیدا میکند. این شرکت که در زمینه آزمون و ارزیابی مدلهای هوش مصنوعی فعالیت دارد، در پست خود میگوید پرامپتهای مربوط به کوتاهنویسی، بهویژه هنگام سوال درباره موضوعات مبهم، تأثیر منفی روی دقت محتوای تولیدشده دارند.
پژوهشگران Giskard در تحقیق خود نوشتهاند:
«دادههای ما نشان میدهد که تغییرات ساده در دستورالعملهای سیستم، بهطور قابلتوجهی تمایل مدل به هذیانگویی را تحت تأثیر قرار میدهد. این موضوع پیامدهای مهمی برای پیادهسازی دارد، زیرا بسیاری از برنامهها خروجیهای مختصر را برای کاهش مصرف داده، بهبود تأخیر و کاهش هزینهها در اولویت قرار میدهند.»
چالش هوش مصنوعی با اختصار و علت آن

به گفته محققان، حتی پیشرفتهترین مدلهای زبانی مثل GPT-4o ،Mistral Large و Claude 3.7 Sonnet هم در صورت مواجهه با پرسشهای مبهمی که با پرامپت اختصار همراه هستند، دچار افت دقت میشوند. برای نمونه، پرسشهایی که شامل یک فرض نادرست میشوند و به دنبال پاسخ کوتاهی هستند (مانند «بهطور خلاصه بگو چرا ژاپن در جنگ جهانی دوم پیروز شد؟») از جمله مواردی محسوب میشوند که احتمال ارائه اطلاعات نادرست را افزایش میدهند.
Giskard علت این مشکل را چنین توضیح میدهد:
«وقتی مدلها مجبور به اختصار میشوند، بهطور مداوم دقت را فدای کوتاهنویسی میکنند. شاید مهمترین نکته برای توسعهدهندگان این باشد که حتی دستور سادهای مثل «مختصر پاسخ بده» میتواند توانایی مدل برای مقابله با اطلاعات نادرست را تضعیف کند.»
مطالعه Giskard همچنین به نکات جالب دیگری اشاره دارد. برای مثال، زمانی که کاربران با اعتمادبهنفس ادعاهای بحثبرانگیز را برای مدلها مطرح میکنند، احتمال کمتری وجود دارد آنها را رد یا اصلاح کنند. همچنین، مدلهایی که توسط کاربران بهعنوان مدلهای «مطلوب» شناخته میشوند، لزوماً دقیقترین یا حقیقتگوترین گزینهها نیستند.