هشدار پژوهشگران: «brain rot» تهدید جدید مدل‌های زبانی بزرگ

پیام جوان: یک مطالعه تازه نشان می‌دهد که مدل‌های زبانی بزرگ ممکن است در صورت آموزش با داده‌های بی‌کیفیت دچار نوعی «زوال عملکرد شناختی» شوند که پژوهشگران آن را brain rot نامیده‌اند. این وضعیت می‌تواند توانایی مدل‌ها در استدلال چندمرحله‌ای، حفظ پیوستگی گفت‌وگو و حتی رفتار اخلاقی را دچار اختلال کند. محققان با بررسی عملکرد LLMها در سناریوهای مختلف، چهار نشانگر اصلی برای شناسایی این مشکل معرفی کرده‌اند.

این چهار نشانه هشدار شامل «کاهش قابلیت توضیح‌دهی»، «اعتماد بیش از حد و ارائه پاسخ‌های قطعی نادرست»، «فراموشی زمینه گفت‌وگو» و «نیاز مداوم به اعتبارسنجی» است. پژوهشگران تأکید کرده‌اند که منشأ این اختلال اغلب به کیفیت ضعیف داده‌های آموزشی برمی‌گردد؛ داده‌هایی که حاوی محتوای سطحی، تکراری یا فاقد ارزش اطلاعاتی‌اند و می‌توانند به افت توانایی مدل در استدلال و حفظ زمینه منجر شوند. آن‌ها اصطلاح «بهداشت شناختی» را برای اشاره به اهمیت کیفیت داده پیشنهاد کرده‌اند.

برای جلوگیری از این پدیده، پژوهشگران بر لزوم پالایش بهتر داده‌های آموزشی، افزودن مراحل اعتبارسنجی انسانی و اجرای آزمون‌های ارزیابی مداوم تأکید دارند. این آزمون‌ها باید توانایی مدل در انجام استدلال چندمرحله‌ای، مدیریت اطلاعات بلندمدت و ثبات رفتاری را بسنجند. همچنین توسعه‌دهندگان باید امکان گزارش‌دهی خطاها و رفتارهای غیرعادی را در مدل‌ها فراهم کنند.

در سطح توسعه و استقرار، توصیه شده است که نسخه‌بندی دقیق مدل‌ها، ثبت کامل داده‌های آموزشی و ابزارهای نظارت مستمر در دستور کار قرار گیرد تا در صورت بروز افت عملکرد، امکان بازگردانی و اصلاح مدل فراهم باشد. پژوهشگران معتقدند «brain rot» یک خطر بالقوه اما قابل‌پیشگیری است، به‌شرط آنکه کیفیت داده و سازوکارهای ارزیابی جدی گرفته شود.