پیام جوان: OpenAI در تازهترین بهروزرسانی ChatGPT، قابلیتهای صوتی این دستیار هوشمند را بهطور چشمگیری ارتقاء داده است. نسخه جدید «حالت پیشرفته صوتی» اکنون میتواند لحن طبیعی، حس همدلی، طعنه، مکثهای انسانی و بیان عاطفی را در گفتار بازتاب دهد. همچنین، امکان «ترجمه همزمان گفتوگو» بدون توقف بین زبانهای مختلف نیز به این نسخه افزوده شده و تجربهای بیسابقه از گفتوگوی زنده را برای کاربران فراهم کرده است.
این فناوری در موقعیتهایی مانند جلسات کاری چندزبانه، سفارش غذا در رستوران یا ارتباط با گردشگران کاربردی توصیف شده است. با وجود این، برخی چالشها همچنان پابرجاست؛ از جمله افت مقطعی کیفیت صدا، تغییرات ناگهانی در لحن یا شدت، و پدیده «توهم صوتی» که گاهی موجب پخش صداهای ناخواسته مانند تبلیغات یا نویز میشود. OpenAI با تأکید بر عدم ارائه تبلیغات در پلتفرم خود، منشأ این رفتارها را در دست بررسی دارد.
از دیگر ویژگیهای چشمگیر این نسخه میتوان به قابلیت تفسیر بصری از طریق دوربین اشاره کرد؛ ChatGPT میتواند اشیای محیطی را شناسایی و توضیح دهد. به اعتقاد کارشناسان، این پیشرفتها نشاندهنده حرکت سریع بهسوی همراهان صوتی هوشمند و مترجمان زنده در دنیای واقعی است. با این حال، همچنان بر لزوم استفاده آگاهانه از این ابزارها تأکید میشود؛ چرا که فهم زبانی و عاطفی انسان همچنان فراتر از توان فعلی هوش مصنوعی است.