فیلم بیشتر »»
کد خبر ۱۱۴۳۲۳۵
تاریخ انتشار: ۰۵:۰۰ - ۰۳-۱۲-۱۴۰۴
کد ۱۱۴۳۲۳۵
انتشار: ۰۵:۰۰ - ۰۳-۱۲-۱۴۰۴

هرچه بیشتر با چت‌بات‌ها صحبت کنید، دقت‌شان کمتر می‌شود!

هرچه بیشتر با چت‌بات‌ها صحبت کنید، دقت‌شان کمتر می‌شود!
ظاهراً دقت مدل‌های هوش مصنوعی در گفت‌وگوهای چندمرحله‌ای طولانی کاهش می‌یابد.

شرکت‌های پیشرو طی سال‌های اخیر مدل‌ها و چت‌بات‌های پیشرفته‌ای را برای تثبیت جایگاه برند خود در بازار پرشتاب هوش مصنوعی معرفی کرده‌اند؛ بازاری که دنبال‌کردن تحولاتش همچنان ساده نیست و با وجود پیشرفت‌های فنی، کاربران همچنان از توهم‌زایی و پاسخ‌های نادرست در تعامل با این مدل‌ها گلایه دارند.

به گزارش زومیت، Microsoft Research و Salesforce در پژوهشی مشترک با تحلیل بیش از ۲۰۰ هزار مکالمه‌ی مرتبط با مدل‌هایی مانند GPT-4.1، Gemini 2.5 Pro، Claude 3.7 Sonnet، o3، DeepSeek R1 و Llama 4، نشان دادند که مدل‌های زبانی بزرگ در مکالمه‌های چندمرحله‌ای دچار افت عملکرد می‌شوند و به‌اصطلاح «در گفت‌وگو گم می‌شوند».

طبق تحقیقات، نرخ موفقیت مدل‌هایی مانند GPT-4.1 و Gemini 2.5 Pro در سناریوهای تک‌درخواستی به حدود ۹۰ درصد می‌رسد؛ اما عملکرد همین مدل‌ها در گفت‌وگوهای رفت‌وبرگشتی طولانی با کاهش محسوسی روبه‌رو می‌شود و میانگین موفقیت آن‌ها به نزدیک ۶۵ درصد سقوط می‌کند.

پژوهش مایکروسافت نشان می‌دهد افت کیفیت لزوماً به‌معنای کاهش چشمگیر توانایی نیست. در واقع، گفته می‌شود هرچه بیشتر با چت‌بات‌ها صحبت کنید، دقت‌شان کمتر خواهد شد.

تحلیل‌ها همچنین از بروز پدیده‌ای با عنوان «تورم پاسخ» حکایت دارند؛ به‌گونه‌ای که طول خروجی‌ها در مکالمه‌های چندنوبتی بین ۲۰ تا ۳۰۰ درصد افزایش می‌یابد. پاسخ‌های مفصل‌تر فرضیات بیشتری وارد متن می‌کنند و احتمال توهم‌زایی را بالا می‌برند؛ خطاهایی که سپس به‌عنوان زمینه‌ی دائمی گفت‌وگو استفاده می‌شوند.

در شرایطی که استفاده از ابزارهای هوش مصنوعی به‌سرعت گسترش پیدا می‌کند و قابلیت‌هایی مانند Google AI Overviews به تجربه‌ی جست‌وجوی افزوده شده‌اند، کنارگذاشتن موتورهای جست‌وجوی سنتی و اتکا به پاسخ‌های تولیدشده با مدل‌های هوش مصنوعی می‌تواند ریسک‌پذیر باشد.

ارسال به دوستان
آکسیوس منتشر کرد: جزئیات «یادداشت تفاهم» ایران و آمریکا امروز با حافظ: خوش خبر باشی ای نسیمِ شِمال ۴۰ درصد تخت‌های بیمارستانی در تصرف سالمندان اقدام نیروی هوایی آمریکا برای امضای توافق با ایران نمک دریایی سلتیک چیست (+اینفوگرافیک) مغز انسان؛ فرماندهی کوچک با قدرتی بی پایان (+اینفوگرافیک) نگاهی به درون کارگاه ساخت زیردریایی 20 هزار تنی و فوق محرمانه کلاس کلمبیا (+عکس) ايران - آمریکا /توافق در ژنو سوئیس امضا می شود/ تماس ایران و ویتکاف از طریق قطری ها در تهران / جزئیات توافق: امکان استفاده ایران از پول های بلوکه شده ؛ کاهش سطح اورانیوم داخل ایران / پرواز 4 هواپیمای پشتیبان سفر ونس به اروپا برای امضای توافق ورود سامانه بارشی به کشور/ احتمال رگبار و رعدوبرق از امروز جمعه ادعای ارتش آمریکا: در حال بررسی گزارش‌ها درباره حمله به تاسیسات آب ایران هستیم رؤیای صحرا؛ لوکس‌ترین قطار خاورمیانه با قیمت نجومی بلیط (+عکس) منیرالملوک و خانواده‌اش با لباس محلی شیرازی؛ 100 سال قبل (عکس) آیا قرار دادن دست روی دنده باعث فرسودگی گیربکس دستی می‌شود؟ جنگلی‌ترین کشورهای قاره اروپا کدامند؟ (+ اینفوگرافیک) اسرار سکونت هزار ساله در شهر زیرزمینی «قدبرا» الیگودرز