آگاه: به گزارش تک کرانچ، GPT‑Realtime‑۲ یک مدل صوتی جدید اوپن ایآی است که برای ایجاد شبیهسازیهای صوتی واقعگرایانه که قادر به محاوره با کاربر هستند، ساخته شده است. با این وجود اپ مذکور برخلاف نسخههای پیشین (GPT-Realtime-۱.۵)، این ابزار با قابلیت استدلال چت جیپیتی ۵ ساخته شده که به گفته اوپن ایآی برای اجرای دستورهای پیچیدهتر کاربران ساخته شده است.
این شرکت همچنین ابزار GPT‑Realtime‑Translate را راهاندازی میکند که سرویس ترجمه لحظهای را فراهم میکند که در مکالمه با کاربر همگام است. این ویژگی شامل ۷۰ زبان ورودی است. این موارد شامل زبانهای قابل درک برای مدل و ۱۳ زبان خروجی است که محتوا را به گوینده منتقل میکند، است.
همچنین این شرکت یک قابلیت رونویسی است که GPT-Realtime-Whisper نامیده میشود و به کاربران امکان تبدیل سخن به متن به طور زنده را میدهد.
سازنده چت جیپیتی در این باره میگوید: مدلهایی که ما در حال عرضه آنها هستیم، صدا را در لحظه از تماس و پاسخ ساده به رابطهای صوتی منتقل میکنند که واقعا کارایی دارند. این مدلها میتوانند گوش دهند، استدلال، ترجمه، رونویسی کنند و همزمان با پیشرفت مکالمه، عمل کنند.
هدف این به روزرسانیها شرکتهایی هستند که میخواهند قابلیتهای سرویس به مشتریان را گسترش دهند. با این وجود اوپن ایآی اشاره میکند ویژگیهای جدید در حوزههای مختلفی از جمله آموزش، رسانه، رویدادها و غیره کاربرد دارد.
۱۹ اردیبهشت ۱۴۰۵ - ۱۲:۱۲
کد مطلب: ۲۲٬۱۱۳
اوپن ایآی اعلام کرد API آن شامل چند ویژگی صوتی هوشمند میشود که برای کمک به توسعهدهندگان جهت ایجاد اپهایی که سخن میگویند، طراحی شدهاند.
نظر شما