پیام جوان: یک مطالعه تازه نشان میدهد که مدلهای زبانی بزرگ ممکن است در صورت آموزش با دادههای بیکیفیت دچار نوعی «زوال عملکرد شناختی» شوند که پژوهشگران آن را brain rot نامیدهاند. این وضعیت میتواند توانایی مدلها در استدلال چندمرحلهای، حفظ پیوستگی گفتوگو و حتی رفتار اخلاقی را دچار اختلال کند. محققان با بررسی عملکرد LLMها در سناریوهای مختلف، چهار نشانگر اصلی برای شناسایی این مشکل معرفی کردهاند.
این چهار نشانه هشدار شامل «کاهش قابلیت توضیحدهی»، «اعتماد بیش از حد و ارائه پاسخهای قطعی نادرست»، «فراموشی زمینه گفتوگو» و «نیاز مداوم به اعتبارسنجی» است. پژوهشگران تأکید کردهاند که منشأ این اختلال اغلب به کیفیت ضعیف دادههای آموزشی برمیگردد؛ دادههایی که حاوی محتوای سطحی، تکراری یا فاقد ارزش اطلاعاتیاند و میتوانند به افت توانایی مدل در استدلال و حفظ زمینه منجر شوند. آنها اصطلاح «بهداشت شناختی» را برای اشاره به اهمیت کیفیت داده پیشنهاد کردهاند.
برای جلوگیری از این پدیده، پژوهشگران بر لزوم پالایش بهتر دادههای آموزشی، افزودن مراحل اعتبارسنجی انسانی و اجرای آزمونهای ارزیابی مداوم تأکید دارند. این آزمونها باید توانایی مدل در انجام استدلال چندمرحلهای، مدیریت اطلاعات بلندمدت و ثبات رفتاری را بسنجند. همچنین توسعهدهندگان باید امکان گزارشدهی خطاها و رفتارهای غیرعادی را در مدلها فراهم کنند.
در سطح توسعه و استقرار، توصیه شده است که نسخهبندی دقیق مدلها، ثبت کامل دادههای آموزشی و ابزارهای نظارت مستمر در دستور کار قرار گیرد تا در صورت بروز افت عملکرد، امکان بازگردانی و اصلاح مدل فراهم باشد. پژوهشگران معتقدند «brain rot» یک خطر بالقوه اما قابلپیشگیری است، بهشرط آنکه کیفیت داده و سازوکارهای ارزیابی جدی گرفته شود.
