فیلم بیشتر »»
کد خبر ۱۱۲۳۰۹۴
تاریخ انتشار: ۰۷:۴۷ - ۲۳-۰۹-۱۴۰۴
کد ۱۱۲۳۰۹۴
انتشار: ۰۷:۴۷ - ۲۳-۰۹-۱۴۰۴

هوش مصنوعی همه‌چیزدان نیست؛ دقت ۶۹ درصدی پیشرفته‌ترین مدل‌ها

هوش مصنوعی همه‌چیزدان نیست؛ دقت ۶۹ درصدی پیشرفته‌ترین مدل‌ها
آمار جدید محققان گوگل نشان می‌دهد که حتی پیشرفته‌ترین مدل هوش مصنوعی موجود دقت ۶۹ درصدی دارد.

گوگل تصویری نگران‌کننده از میزان دقت هوش مصنوعی در بیان حقایق به دست آورد. گوگل دیپ‌مایند هفته‌ی گذشته از مجموعه‌ی بنچمارک FACTS رونمایی کرد؛ ابزاری برای سنجش اعتبار و درستی پاسخ‌های مدل‌های AI.

به گزارش زومیت، این بنچمارک مدل‌ها را در چهار حوزه‌ی کلیدی به چالش می‌کشد: پاسخ به پرسش‌های واقعی بر اساس دانش درونی، استفاده‌ی مؤثر از جست‌وجوی وب، استناد دقیق به اسناد طولانی و تفسیر تصاویر. در این آزمون، جمنای ۳ پرو گوگل با کسب امتیاز ۶۹ درصد، بهترین عملکرد را به ثبت رساند؛ درحالی‌که سایر مدل‌های پیشرو با اختلاف فاحشی پایین‌تر از این سطح قرار گرفتند.

آمار مذکور باید زنگ خطری جدی برای کسب‌وکارهایی باشد که روی هوش مصنوعی شرط بسته‌اند. اگرچه مدل‌ها در سرعت و شیوایی کلام بی‌نظیرند؛ اما قابلیت اطمینان آن‌ها در بیان حقایق همچنان فرسنگ‌ها با انتظارات انسانی فاصله دارد؛ به‌ویژه در وظایفی که نیازمند دانش تخصصی، استدلال پیچیده یا استناد دقیق به منابع هستند.

حتی خطاهای واقعی کوچک در صنایعی مانند امور مالی، بهداشت و درمان و حقوق می‌توانند پیامدهای ویرانگری به‌همراه داشته باشند. یکی از خبرنگاران روایت می‌کند که چگونه یک شرکت حقوقی، کارمندش را به دلیل استفاده از ChatGPT در تنظیم لایحه‌ای که مملو از پرونده‌های ساختگی بود، اخراج کرد.

بنچمارک FACTS هم هشدار است و هم نقشه‌ی راه؛ گوگل امید دارد با کاهش نقاط شکست و نحوه‌ی خطای مدل‌ها، پیشرفت در این حوزه را شتاب ببخشد. اما فعلاً پیام روشن است: هوش مصنوعی بهتر می‌شود؛ اما همچنان در حدود یک‌سوم موارد اشتباه می‌کند.

ارسال به دوستان
برگزیدگان کن۲۰۲۶ معرفی شدند کاهش قیمت تتر به کانال 167 هزار تومان هزینه ثبت نام کنکور ۱۴۰۵ و آزمون اختصاصی دانشجو معلمان چقدر است؟ رسانه‌ها مالیات بدهند، اما ۹۰ درصد اصناف نه! مونیکا ویت کیست؛ نظامی سابق آمریکایی که به جاسوسی برای ایران متهم شد و اف‌بی‌آی برای او جایزه تعیین کرد اعدام «مجتبی کیان» 50 روز پس از بازداشت/ اتهام: ارسال آدرس مکان یک واحد صنعتی نظامی به تلویزیون معاند وقتی اینترنت را محدود می کنید این پیام را به دشمن می دهید که کشور ما در بحران است ماجرای توقف تسهیلات ارزی کالای اساسی/فهرست بدهکاران به بانک مرکزی رفت واردات کالا‌های اساسی تا پایان شهریور آزاد شد کدام پیاده‌روی بهتر است: سریع‌تر یا طولانی‌تر؟ واکنش خبرگزاری فارس به ‌ادعای ترامپ درباره «بازگشت تنگه هرمز به حالت قبل» سهم بیمه کارفرمایان، و محل حقوق بازنشستگان تغییر می‌ کند؟ فراموش‌شدگان؛ روایتی از روزگار بیماران اسکیزوفرنی تایتانیک، خانه مجردان یا خانه کارگران اتمی ؛ نام های عجیب برای یک ساختمان عجیب در مسکو (+تصاویر) تصویر رنگی‌شده از «میدان توپخانه» در زمان ناصرالدین شاه