۱۹ اردیبهشت ۱۴۰۵ - ۱۲:۱۲
کد مطلب: ۲۲٬۱۱۳

اوپن ای‌آی اعلام کرد API آن شامل چند ویژگی صوتی هوشمند می‌شود که برای کمک به توسعه‌دهندگان جهت ایجاد اپ‌هایی که سخن می‌گویند، طراحی شده‌اند.

اوپن ای‌آی ویژگی صوت هوشمند ارائه می‌کند

آگاه: به گزارش تک کرانچ، GPT‑Realtime‑۲ یک مدل صوتی جدید اوپن ای‌آی است که برای ایجاد شبیه‌سازی‌های صوتی واقع‌گرایانه که قادر به محاوره با کاربر هستند، ساخته شده است. با این وجود اپ مذکور برخلاف نسخه‌های پیشین (GPT-Realtime-۱.۵)، این ابزار با قابلیت استدلال چت جی‌پی‌تی ۵ ساخته شده که به گفته اوپن ای‌آی برای اجرای دستورهای پیچیده‌تر کاربران ساخته شده است.
این شرکت همچنین ابزار GPT‑Realtime‑Translate را راه‌اندازی می‌کند که سرویس ترجمه لحظه‌ای را فراهم می‌کند که در مکالمه با کاربر همگام است. این ویژگی شامل ۷۰ زبان ورودی است. این موارد شامل زبان‌های قابل درک برای مدل و ۱۳ زبان خروجی است که محتوا را به گوینده منتقل می‌کند، است.
همچنین این شرکت یک قابلیت رونویسی است که GPT-Realtime-Whisper نامیده می‌شود و به کاربران امکان تبدیل سخن به متن به طور زنده را می‌دهد.
سازنده چت جی‌پی‌تی در این باره می‌گوید: مدل‌هایی که ما در حال عرضه آنها هستیم، صدا را در لحظه از تماس و پاسخ ساده به رابط‌های صوتی منتقل می‌کنند که واقعا کارایی دارند. این مدل‌ها می‌توانند گوش دهند، استدلال، ترجمه، رونویسی کنند و همزمان با پیشرفت مکالمه، عمل کنند.
هدف این به روزرسانی‌ها شرکت‌هایی هستند که می‌خواهند قابلیت‌های سرویس به مشتریان را گسترش دهند. با این وجود اوپن ای‌آی اشاره می‌کند ویژگی‌های جدید در حوزه‌های مختلفی از جمله آموزش، رسانه، رویدادها و غیره کاربرد دارد.

برچسب‌ها

نظر شما

شما در حال پاسخ به نظر «» هستید.
  • نظرات حاوی توهین و هرگونه نسبت ناروا به اشخاص حقیقی و حقوقی منتشر نمی‌شود.
  • نظراتی که غیر از زبان فارسی یا غیر مرتبط با خبر باشد منتشر نمی‌شود.