۰۷ بهمن ۱۴۰۴
به روز شده در: ۰۷ بهمن ۱۴۰۴ - ۱۹:۱۶
فیلم بیشتر »»
کد خبر ۱۱۱۹۱۹۳
تاریخ انتشار: ۱۲:۵۷ - ۱۰-۰۹-۱۴۰۴
کد ۱۱۱۹۱۹۳
انتشار: ۱۲:۵۷ - ۱۰-۰۹-۱۴۰۴

هوش مصنوعی با شعر فریب می‌خورد!

هوش مصنوعی با شعر فریب می‌خورد!
در مطالعه‌ای که توسط آزمایشگاه «ایکارو» با عنوان «شعر خصمانه به عنوان یک مکانیسم فرار از زندان تک‌چرخه‌ای جهانی در مدل‌های زبان بزرگ» منتشر شده است، محققان توانستند با بیان دستور LLMها با شعر، مکانیسم‌های ایمنی مختلف آنها را دور بزنند.

محققان می‌گویند می‌توان چت‌بات‌های هوش مصنوعی را با شعر فریب داد تا از موانع امنیتی خود چشم‌پوشی کنند.

به گزارش ایسنا، یک مطالعه اخیر از آزمایشگاه ایکارو(Icaro) با استفاده از یک ساختار شاعرانه، مدل‌های زبانی بزرگ(LLM) را برای ارائه اطلاعات در مورد موضوعات ممنوعه مانند ساخت بمب هسته‌ای آزمایش کرد و در نهایت معلوم شد که تنها چیزی که برای عبور از موانع امنیتی یک چت‌بات هوش مصنوعی نیاز دارید، کمی خلاقیت است.

به نقل از انگجت، در مطالعه‌ای که توسط آزمایشگاه «ایکارو» با عنوان «شعر خصمانه به عنوان یک مکانیسم فرار از زندان تک‌چرخه‌ای جهانی در مدل‌های زبان بزرگ» منتشر شده است، محققان توانستند با بیان دستور LLMها با شعر، مکانیسم‌های ایمنی مختلف آنها را دور بزنند.

طبق این مطالعه، عبارت‌های شاعرانه به عنوان یک اپراتور فرار از زندان عمومی عمل می‌کند و نتایج نشان می‌دهد که میزان موفقیت کلی در تولید مطالب ممنوعه، از جمله هر چیزی که مربوط به ساخت سلاح‌های هسته‌ای، مطالب مربوط به سوءاستفاده‌های جنسی از کودکان و خودکشی یا خودآزاری، ۶۲ درصد است.

این مطالعه مدل‌های زبانی بزرگ محبوب از جمله مدل‌های ChatGPT شرکت OpenAI، هوش مصنوعی جمینای(Google) گوگل، هوش مصنوعی کلاد(Claude) شرکت آنتروپیک:(Anthropic) و بسیاری دیگر را آزمایش کرد.

محققان میزان موفقیت هر LLM را بررسی کردند، به طوری که مدل‌های جمینای، دیپ‌سیک(DeepSeek) و MistralAI به طور مداوم پاسخ‌هایی ارائه می‌دادند، در حالی که مدل‌های GPT-5 و Claude Haiku 4.5 کمترین احتمال را برای عبور از محدودیت‌های خود داشتند.

محققان می‌گویند شعری که در این مطالعه استفاده شد، برای به اشتراک گذاشتن با عموم بسیار خطرناک است. با این حال، این مطالعه شامل یک نسخه رقیق شده بود تا نشان دهد که دور زدن موانع یک چت‌بات هوش مصنوعی چقدر آسان است.

محققان می‌گویند این کار احتمالاً آسان‌تر از آن چیزی است که ممکن است تصور شود و دقیقاً به همین دلیل است که ما محتاط هستیم.

ارسال به دوستان
تحلیل کارشناس روس از سلاح‌های محرمانه آمریکا در عملیات ونزوئلا واگذاری ۷۰ همت دارایی مازاد؛ بانک ملی ایران الگوی موفق در خروج از بنگاه‌داری و حمایت از تولید/ حمایت از تولید و اشتغال گامی در جهت توسعه اقتصادی کشور برنامه‌نویسان: ۴۰۰ ساعت خاموشی اینترنت، برنامه‌نویسی را از یادمان برد! پوشش زنده رقابت‌های فوتسال آسیا از فردا «خانه انیس الدوله» الماس امیریه/ زنی که قلیان سلطان صاحبقران را شکست/ ارتباط جالب دکتر حسابی با این خانه امکان فعالسازی خدمات «ساپتا» بانک ملی ایران برای مشتریان بانک آینده سابق فراهم شد جامعه تورگردانان ایران: دولت از ما حمایت نمی‌کند و مالیات هم می خواهد ترامپ: پایان جنگ اوکراین نزدیک است تداوم غیبت اسکوچیچ در نشست‌های خبری نیم‌فصل دوم اعلام نامزدهای جوایز فیلم بفتا ؛ «یک نبرد پس از دیگری» در صدر عارف: اولویت دولت، نفع مردم است ترکیه ایجاد «منطقه حائل» در مرز با ایران را تکذیب کرد امضای «بزرگترین توافق تجاری» میان هند و اتحادیه اروپا پول را بده و حرف نزن! ناآرامی‌های اخیر و دانش‌آموزانی که دانش‌آموز نبودند!