نقش حیاتی معماری در هوش مصنوعی: یادگیری مغزگون پیش از آموزش

پیام جوان: یک مطالعه جدید که در نشریه معتبر Nature Machine Intelligence منتشر شده است، رویکردی نوین به ساخت و آموزش مدل‌های هوش مصنوعی ارائه می‌دهد. پژوهشگران دانشگاه جانز هاپکینز، به سرپرستی استاد علوم شناختی، میک بونر، نشان داده‌اند که انتخاب معماری مناسب برای شبکه‌های عصبی می‌تواند به‌طور چشمگیری توانایی یادگیری و شباهت به عملکرد مغز انسان را افزایش دهد، حتی پیش از آنکه این سیستم‌ها تحت آموزش گسترده قرار گیرند. این یافته‌ها مسیر تازه‌ای را برای توسعه هوش مصنوعی کارآمدتر و زیست‌شناختی‌تر هموار می‌سازند.

در سال‌های اخیر، روند غالب در توسعه هوش مصنوعی بر اتکا به حجم عظیمی از داده‌ها و منابع محاسباتی بسیار پرهزینه استوار بوده است که میلیاردها دلار سرمایه و انرژی فراوان را مصرف می‌کند. این در حالی است که مغز انسان با داده‌های محدود و تجربیات اندک قادر به یادگیری و پردازش‌های پیچیده است. این تضاد آشکار، محققان را بر آن داشت تا به جای تمرکز صرف بر داده‌ها، نقش حیاتی معماری در عملکرد و کارایی شبکه‌های عصبی مصنوعی را مورد بررسی عمیق قرار دهند.

در این تحقیق، سه دسته اصلی از معماری‌های رایج شبکه‌های عصبی، شامل ترنسفورمرها، شبکه‌های کاملاً متصل و شبکه‌های کانولوشنی، مورد ارزیابی قرار گرفتند. تیم پژوهشی با ایجاد تغییرات ساختاری متعدد در این معماری‌ها، ده‌ها شبکه عصبی جدید را بدون هیچ‌گونه آموزش قبلی در معرض تصاویر متنوعی از اشیاء، انسان‌ها و حیوانات قرار داد. نتایج حاصل از این آزمایش‌ها نشان داد که در حالی که افزایش تعداد نورون‌های مصنوعی در ترنسفورمرها و شبکه‌های کاملاً متصل تغییر چندانی ایجاد نمی‌کند، اصلاح معماری شبکه‌های کانولوشنی توانست الگوهای فعالیتی تولید کند که شباهت قابل توجهی به الگوهای فعالیت مغزی انسان و نخستی‌ها داشت.

این مطالعه تأکید می‌کند که معماری شبکه‌ها، حتی بدون نیاز به آموزش گسترده و پرهزینه، نقشی کلیدی در دستیابی به عملکردی شبیه مغز ایفا می‌کند. به گفته بونر، اگر آموزش بر داده‌های عظیم تنها عامل حیاتی بود، تغییر معماری نمی‌توانست چنین نتایجی به بار آورد. این کشف نه تنها چالش جدی برای مدل‌های میلیارد دلاری کنونی محسوب می‌شود، بلکه چشم‌اندازی نو برای طراحی هوش مصنوعی کارآمدتر، کم‌هزینه‌تر و نزدیک‌تر به مغز انسان ترسیم می‌کند و مسیر آینده هوش مصنوعی را از وابستگی صرف به داده‌های بی‌پایان جدا می‌سازد.