تشخیص گفتار خودکار (ASR) در فیسبوک با کمک
دانشمندان
گفتنی است موتورهای ASR معمولا قادر به درک تنها یک زبان هستند. بدین ترتیب، برای ارتباط برقرار ساختن با بیش از یک زبان، ترکیب مدلهای مختلف ASR برای دستیار صوتی و بالا بردن
در این سیستم زبانهای مختلف به چندین زیرشاخه تبدیل میشوند. این کار به منظور پاسخ به زبانی است که شخص در حال گفتوگو با آن است.
مدل واحد ارائه شده توسط فیسبوک، قابلیت تشخیص همزمان چندین زبان را دارد. این پروژه از جمله پروژههای بلند مدت فیسبوک بود که با موفقیت انجام شد. به طور کل، پردازش گفتار به چند زبان مختلف، دهههاست که به منطقه فعال تحقیقاتی تبدیل شده است.
تقریبا بیلیونها بیلیون پارامتر مختلف برای زبان در مدل جدید فیسبوک در نظر گرفته شده که فرایند تشخیص گفتار را در مقایسه با مدلهای معمولی برجستهتر ساخته است. گفتنی است که پیشرفت عملکرد مدل جدید ارائه شده توسط فیسبوک، 28.8% است.
زبانهایی که ساعات ضبط کمتری داشتهاند، از نظر میزان خطای واژگانی، درصد خطای بیشتری دارند. علت را میتوان در این امر جستوجو کرد که این زبانها به طور معمول برای طراحیهای استانداردهای روز دنیا استفاده نمیشوند.
مطابق با سخنگوی فیسبوک، این پروژه، اولین و بزرگترین پروژه در زمینه تشخیص گفتار در جهان است که در مقیاسی بزرگ، زبانهای زنده گوناگون جهان را مورد مطالعه قرار داده است. سخنگوی فیسبوک همچنین ادامه داد که “ما نشان دادیم که امکان برقراری 51 زبان زنده مختلف در دنیا در یک ساختمان واحد و حجیم ASR وجود دارد.
علاقه
چنین پروژههایی به همراه آزمایشهای جدید، ممکن است زمینه جدیدی برای دستیار صوتی در سیستم عامل فیسبوک فراهم آورد. سیستم واحدی که قادر به تکلم و ارتباط برقرار کردن به چندین و چند زبان زنده دنیا باشد، برای بقای این شرکت در صحنه بینالملل لازم و ضروری است.
الکسا و دستیار گوگل (Google Assistant)، بسیار قبلتر از فیسبوک از موتورهای تشخیص گفتار استفاده میکردند و قادر به تکلم به زبانهای مختلفی بودند، اما حالتهای چند زبانه آنان دارای محدودیتهای قابل توجهی است. الکسا توانایی تشخیص و پاسخگویی به زبانهای انگلیسی، اسپانیایی، فرانسوی و هندی با توجه به موقعیت جغرافیایی گوینده دارد. در همین حال، دستیار گوگل (Google Assistant) قادر به تشخیص و پاسخگویی دو زبان، انگلیسی و هر زبان دیگری که قبلا توسط دستیار صوتی گوگل (voice assistant) با آن صحبت شده، است.
فناوری تبدیل گفتار به نوشتار، دیگر لازم نیست بنویسیم
چرا به اپلیکیشن خود قابلیت تایپ صوتی اضافه کنیم؟
کاربردهای فناوری تبدیل گفتار به نوشتار
معرفی یک نرم افزار تبدیل گفتار به نوشتار کاربردی برای دسکتاپ
معرفی نرم افزار فارس آوا با قابلیت تایپ صوتی فارسی
تبدیل گفتار به نوشتار چگونه کار می کند؟
معرفی یک نرم افزار با کیفیت ایرانی برای تبدیل گفتار به نوشتار فارسی