پیام جوان: غول دنیای پردازش، IBM، امروز اعلام کرد که شرکت Deepgram را به عنوان اولین شریک رسمی صوتی خود برای پلتفرم هوش مصنوعی watsonx انتخاب کرده است. این همکاری با هدف ادغام قابلیتهای پیشرفته تبدیل گفتار به متن (STT) و متن به گفتار (TTS) در اکوسیستمهای سازمانی صورت میگیرد تا تعامل انسان و ماشین به سطح جدیدی از طبیعی بودن برسد.
تکنولوژی Deepgram به دلیل تأخیر بسیار کم و دقت بالا در محیطهای پرسر و صدا شناخته میشود. با این ادغام، کاربران پلتفرم واتسون ایکس قادر خواهند بود ایجنتهای (Agent) صوتی بسازند که نه تنها لهجهها و گویشهای مختلف را به خوبی متوجه میشوند، بلکه قادرند در لحظه و با صدای کاملاً انسانی پاسخ دهند.
یکی از ویژگیهای برجسته این همکاری، پشتیبانی گسترده از زبانها و لهجههای منطقهای است که تا پیش از این برای هوش مصنوعی چالشبرانگیز بود. این سیستمها در حوزههایی مانند خدمات مشتریان، تحلیل تماسهای تلفنی در بخش مالی و ثبت دادههای پزشکی به صورت صوتی، تحولی بزرگ ایجاد خواهند کرد.
مدیرعامل Deepgram اعلام کرد که صدا در حال تبدیل شدن به رابط کاربری پیشفرض بین انسان و تکنولوژی است. استفاده از هوش مصنوعی مولد در لایه صوت، به شرکتها اجازه میدهد تا فرآیندهای اداری و عملیاتی خود را که پیش از این به تایپ یا کلیک وابسته بود، کاملاً صوتی و خودکار کنند.
این حرکت IBM نشاندهنده رقابت شدید در بازار “Agentic AI” است؛ جایی که هوش مصنوعی دیگر فقط یک چتبات ساده نیست، بلکه به عنوان یک همکار فعال در محیط کار حضور دارد. انتظار میرود این سیستمهای صوتی جدید طی ماههای آینده در صنایع بزرگ ایالات متحده عملیاتی شوند.















