پیام جوان: مطالعهای جدید از دانشگاه ادینبرو نشان میدهد که برخی از پیشرفتهترین سامانههای هوش مصنوعی، با وجود توانایی در انجام وظایف پیچیده مانند نوشتن متن یا تولید تصویر، در درک مفاهیمی ساده مانند خواندن ساعت یا تشخیص تاریخ در تقویم، با چالشهای جدی روبهرو هستند. در این پژوهش، مدلهای چندوجهی زبانی (MLLMs) هنگام مواجهه با تصاویر ساعتهای آنالوگ و تقویمها، نتایج ضعیفی در تشخیص زمان و تاریخ ارائه دادند.
پژوهشگران با آزمایش مدلهای هوش مصنوعی در موقعیتهای گوناگون از جمله ساعتهایی با اعداد رومی، عقربههای تزئینی و حذف عقربه ثانیهشمار، دریافتند که در بهترین حالت این مدلها تنها در کمتر از یکچهارم موارد موفق به تشخیص صحیح زمان شدهاند. عملکرد ضعیف در تفسیر زاویهها و ترکیب اطلاعات فضایی، دلیل اصلی این ناکامی عنوان شده است. همچنین در پاسخ به پرسشهای مربوط به تقویم، حتی بهترین مدلها نیز در ۲۰٪ موارد دچار خطا شدند.
این یافتهها قرار است در کنفرانس بینالمللی ICLR 2025 در سنگاپور ارائه شود و به باور پژوهشگران، ضرورت توجه به مهارتهای پایهای هوش مصنوعی را نشان میدهد. روهیت ساکسنا، سرپرست تیم تحقیق، تأکید کرد که ضعف سامانههای هوش مصنوعی در چنین وظایف سادهای میتواند مانعی جدی برای استفاده مؤثر از آنها در کاربردهای واقعی مانند زمانبندی، رباتهای کمکی یا ابزارهای مرتبط با نابینایان باشد. این پژوهش تلنگری است به جامعه علمی برای تمرکز بیشتر بر رفع این خلأهای بنیادی.