پیام جوان: یک مطالعه جدید که در نشریه معتبر Nature Machine Intelligence منتشر شده است، رویکردی نوین به ساخت و آموزش مدلهای هوش مصنوعی ارائه میدهد. پژوهشگران دانشگاه جانز هاپکینز، به سرپرستی استاد علوم شناختی، میک بونر، نشان دادهاند که انتخاب معماری مناسب برای شبکههای عصبی میتواند بهطور چشمگیری توانایی یادگیری و شباهت به عملکرد مغز انسان را افزایش دهد، حتی پیش از آنکه این سیستمها تحت آموزش گسترده قرار گیرند. این یافتهها مسیر تازهای را برای توسعه هوش مصنوعی کارآمدتر و زیستشناختیتر هموار میسازند.
در سالهای اخیر، روند غالب در توسعه هوش مصنوعی بر اتکا به حجم عظیمی از دادهها و منابع محاسباتی بسیار پرهزینه استوار بوده است که میلیاردها دلار سرمایه و انرژی فراوان را مصرف میکند. این در حالی است که مغز انسان با دادههای محدود و تجربیات اندک قادر به یادگیری و پردازشهای پیچیده است. این تضاد آشکار، محققان را بر آن داشت تا به جای تمرکز صرف بر دادهها، نقش حیاتی معماری در عملکرد و کارایی شبکههای عصبی مصنوعی را مورد بررسی عمیق قرار دهند.
در این تحقیق، سه دسته اصلی از معماریهای رایج شبکههای عصبی، شامل ترنسفورمرها، شبکههای کاملاً متصل و شبکههای کانولوشنی، مورد ارزیابی قرار گرفتند. تیم پژوهشی با ایجاد تغییرات ساختاری متعدد در این معماریها، دهها شبکه عصبی جدید را بدون هیچگونه آموزش قبلی در معرض تصاویر متنوعی از اشیاء، انسانها و حیوانات قرار داد. نتایج حاصل از این آزمایشها نشان داد که در حالی که افزایش تعداد نورونهای مصنوعی در ترنسفورمرها و شبکههای کاملاً متصل تغییر چندانی ایجاد نمیکند، اصلاح معماری شبکههای کانولوشنی توانست الگوهای فعالیتی تولید کند که شباهت قابل توجهی به الگوهای فعالیت مغزی انسان و نخستیها داشت.
این مطالعه تأکید میکند که معماری شبکهها، حتی بدون نیاز به آموزش گسترده و پرهزینه، نقشی کلیدی در دستیابی به عملکردی شبیه مغز ایفا میکند. به گفته بونر، اگر آموزش بر دادههای عظیم تنها عامل حیاتی بود، تغییر معماری نمیتوانست چنین نتایجی به بار آورد. این کشف نه تنها چالش جدی برای مدلهای میلیارد دلاری کنونی محسوب میشود، بلکه چشماندازی نو برای طراحی هوش مصنوعی کارآمدتر، کمهزینهتر و نزدیکتر به مغز انسان ترسیم میکند و مسیر آینده هوش مصنوعی را از وابستگی صرف به دادههای بیپایان جدا میسازد.















