همکاری استراتژیک IBM و Deepgram برای متحول کردن صدای هوش مصنوعی

پیام جوان: غول دنیای پردازش، IBM، امروز اعلام کرد که شرکت Deepgram را به عنوان اولین شریک رسمی صوتی خود برای پلتفرم هوش مصنوعی watsonx انتخاب کرده است. این همکاری با هدف ادغام قابلیت‌های پیشرفته تبدیل گفتار به متن (STT) و متن به گفتار (TTS) در اکوسیستم‌های سازمانی صورت می‌گیرد تا تعامل انسان و ماشین به سطح جدیدی از طبیعی بودن برسد.

تکنولوژی Deepgram به دلیل تأخیر بسیار کم و دقت بالا در محیط‌های پرسر و صدا شناخته می‌شود. با این ادغام، کاربران پلتفرم واتسون ایکس قادر خواهند بود ایجنت‌های (Agent) صوتی بسازند که نه تنها لهجه‌ها و گویش‌های مختلف را به خوبی متوجه می‌شوند، بلکه قادرند در لحظه و با صدای کاملاً انسانی پاسخ دهند.

یکی از ویژگی‌های برجسته این همکاری، پشتیبانی گسترده از زبان‌ها و لهجه‌های منطقه‌ای است که تا پیش از این برای هوش مصنوعی چالش‌برانگیز بود. این سیستم‌ها در حوزه‌هایی مانند خدمات مشتریان، تحلیل تماس‌های تلفنی در بخش مالی و ثبت داده‌های پزشکی به صورت صوتی، تحولی بزرگ ایجاد خواهند کرد.

مدیرعامل Deepgram اعلام کرد که صدا در حال تبدیل شدن به رابط کاربری پیش‌فرض بین انسان و تکنولوژی است. استفاده از هوش مصنوعی مولد در لایه صوت، به شرکت‌ها اجازه می‌دهد تا فرآیندهای اداری و عملیاتی خود را که پیش از این به تایپ یا کلیک وابسته بود، کاملاً صوتی و خودکار کنند.

این حرکت IBM نشان‌دهنده رقابت شدید در بازار “Agentic AI” است؛ جایی که هوش مصنوعی دیگر فقط یک چت‌بات ساده نیست، بلکه به عنوان یک همکار فعال در محیط کار حضور دارد. انتظار می‌رود این سیستم‌های صوتی جدید طی ماه‌های آینده در صنایع بزرگ ایالات متحده عملیاتی شوند.