کد خبر ۱۱۲۳۰۹۴
تاریخ انتشار: ۰۷:۴۷ - ۲۳-۰۹-۱۴۰۴
کد ۱۱۲۳۰۹۴
انتشار: ۰۷:۴۷ - ۲۳-۰۹-۱۴۰۴

هوش مصنوعی همه‌چیزدان نیست؛ دقت ۶۹ درصدی پیشرفته‌ترین مدل‌ها

هوش مصنوعی همه‌چیزدان نیست؛ دقت ۶۹ درصدی پیشرفته‌ترین مدل‌ها
آمار جدید محققان گوگل نشان می‌دهد که حتی پیشرفته‌ترین مدل هوش مصنوعی موجود دقت ۶۹ درصدی دارد.

گوگل تصویری نگران‌کننده از میزان دقت هوش مصنوعی در بیان حقایق به دست آورد. گوگل دیپ‌مایند هفته‌ی گذشته از مجموعه‌ی بنچمارک FACTS رونمایی کرد؛ ابزاری برای سنجش اعتبار و درستی پاسخ‌های مدل‌های AI.

به گزارش زومیت، این بنچمارک مدل‌ها را در چهار حوزه‌ی کلیدی به چالش می‌کشد: پاسخ به پرسش‌های واقعی بر اساس دانش درونی، استفاده‌ی مؤثر از جست‌وجوی وب، استناد دقیق به اسناد طولانی و تفسیر تصاویر. در این آزمون، جمنای ۳ پرو گوگل با کسب امتیاز ۶۹ درصد، بهترین عملکرد را به ثبت رساند؛ درحالی‌که سایر مدل‌های پیشرو با اختلاف فاحشی پایین‌تر از این سطح قرار گرفتند.

آمار مذکور باید زنگ خطری جدی برای کسب‌وکارهایی باشد که روی هوش مصنوعی شرط بسته‌اند. اگرچه مدل‌ها در سرعت و شیوایی کلام بی‌نظیرند؛ اما قابلیت اطمینان آن‌ها در بیان حقایق همچنان فرسنگ‌ها با انتظارات انسانی فاصله دارد؛ به‌ویژه در وظایفی که نیازمند دانش تخصصی، استدلال پیچیده یا استناد دقیق به منابع هستند.

حتی خطاهای واقعی کوچک در صنایعی مانند امور مالی، بهداشت و درمان و حقوق می‌توانند پیامدهای ویرانگری به‌همراه داشته باشند. یکی از خبرنگاران روایت می‌کند که چگونه یک شرکت حقوقی، کارمندش را به دلیل استفاده از ChatGPT در تنظیم لایحه‌ای که مملو از پرونده‌های ساختگی بود، اخراج کرد.

بنچمارک FACTS هم هشدار است و هم نقشه‌ی راه؛ گوگل امید دارد با کاهش نقاط شکست و نحوه‌ی خطای مدل‌ها، پیشرفت در این حوزه را شتاب ببخشد. اما فعلاً پیام روشن است: هوش مصنوعی بهتر می‌شود؛ اما همچنان در حدود یک‌سوم موارد اشتباه می‌کند.

پربیننده ترین پست همین یک ساعت اخیر
ارسال به دوستان
۲۵ شغل پردرآمد که پیش‌بینی می‌شود در دهه آینده رشد زیادی داشته باشند زحل «آواز ارواح» را می‌خواند / صداهای ترسناکی که از فضا به گوش می‌رسد ‌نشانه‌های خطرناک در بدن‌های لاغر / آیا درون شما یک بمب ساعتی فعال است؟ عکس آتلیه‌ای خانوادۀ مسیحی در دوران قاجار یکی از خطرناک‌ترین مکان‌ها برای تعویض لاستیک پنچر؛ چرا هرگز نباید این کار را بکنید؟ هر وقت طوفان شد، منتظر زلزله باشیم؟ / پیش‌بینی زلزله از روی جهت یا سرعت باد، در قلمرو شبه‌علم قرار دارد «التهاب» به زبان ساده ؛ قوی ترین غذاهای ضدالتهابی کدام اند؟ (+علائم) النصر قهرمان لیگ عربستان شد؛ درخشش رونالدو در شب پیروزی العربیه مدعی لغو سفر فرمانده ارتش پاکستان به ایران شد اظهارات سناتور پاکستانی درباره پیشرفت مذاکرات ایران و آمریکا آمریکا: اتهام قتل علیه کاسترو / بازگشایی پرونده بعد از 30 سال افزایش امنیت آیفون با یک ترفند ساده؛ حذف نشانگر «کنترل سنتر» از صفحه قفل آیفون چه مزایایی دارد؟ نخست‌وزیر عراق: اجازه استفاده از خاک خود برای تجاوز به همسایگان را نمی‌دهیم واشنگتن‌پست: آمریکا نیمی از موشک‌های «تاد» خود را در دفاع از اسرائیل مصرف کرد قتل خواهر و خواهرزاده در بابل / قاتل دستگیر شد