آگاه: به نقل از فیز، از قابلیت تبدیل صدا به متن در موبایل گرفته تا زیرنویسهایی که ویدیوها را قابلدسترستر میکنند، تبدیل گفتار به نوشتار در زندگی روزمره جا افتاده است. در پشت صحنه، هوش مصنوعی کارهای سنگین را انجام میدهد و کلام گفتاری را با سرعت و دقتی که زمانی غیرممکن به نظر میرسید، به متن تبدیل میکند.
در همین راستا ابر رایانه Lonestar ۶ در مرکز رایانش پیشرفته تگزاس، به محققان گفتارشناسی دانشگاه تگزاس در دالاس امکان داد مرزهای شناسایی خودکار زبان (ASR) برای کودکان را ارتقا دهند. پژوهشگران با ابداع انتزاعات ریاضی به نام «واحدهای گفتاری گسسته» از صدا به عنوان نوعی رمزگذاری ناشناس، میتوانند مشکلات گفتار و زبان را در کودکان خردسال شناسایی و مداخل پزشکی سریعتری را برای کمک به آنها فراهم کنند. ساتویک داتا، دانشجوی دکترای مدرسه مهندسی و علوم کامپیوتر اریک جانسون و بورسیه تحصیلات تکمیلی یوجین مکدرموت در دانشگاه تگزاس در دالاس میگوید: هدف ما این است که بتوانیم نحوه صحبت کردن کودکان را درک و تحلیل کنیم. وی در این باره میافزاید: طی سالها، توسعه چنین سیستمهایی به خصوص برای کودکان بسیار چالشبرانگیز بوده است. زیرا کودکان به خصوص کمتر از هشت سال سن هنوز در حال یادگیری مهارتهای گفتاری و صوتی خود هستند و دانششان از دستور زبان هم کامل نیست. گفتار آنها تفاوت زیادی با دادههای گفتاری بزرگسالان دارد که اغلب برای آموزش سیستمهای ASR متنباز استفاده میشود و این باعث میشود عملکرد مدلها در تشخیص گفتار کودکان ضعیف باشد.
فرآیند تبدیل به واحدهای گسسته گفتار، لایههای افزونگی دادهای را حذف کرده و نیازهای کلی آموزش و محاسباتی مدل تشخیص گفتار خودکار (ASR) را کاهش میدهد.
۴ شهریور ۱۴۰۴ - ۱۲:۲۲
با کمک هوش مصنوعی ابزاری توسعه داده شده تا مشکلات گفتار و زبان در کودکان زودتر امکانپذیر شود.