مایکروسافت در زمینه تشخیص گفتار دستاورد جدیدی را به ثبت رساند که با قدرت شنیداری انسان برابری می کند

نوشته شده توسط اپریویو در تاریخ http://apprv.ir/PbDdP

این روزها تعامل با وسایل الکترونیکی از روش های گوناگونی صورت می پذیرد و پیشرفت در این زمینه با سرعت زیادی به وقوع می پیوندد، یکی از شیوه های تعامل استفاده از گفتار برای ارتباط با دستگاه ها و علی الخصوص اسمارت فون ها می باشد. تمامی اسمارت فون های مدرن، دستیارهای صوتی پیش ساخته ای را در خود جای داده و از قابلیت تایپ صوتی برخوردارند. اما میزان دقت این نرم افزارهای تشخیص گفتار هنوز هم مسئاله ساز بوده و تلاش بیشتری در این زمینه را می طلبد، چرا که این سیستم ها، مخصوصا در محیط های پر سر و صدا مستعد خطا می باشند.

کمپانی مایکروسافت یکی از فعالان موفق در این زمینه می باشد که تاکنون نیز موفقیت های چشمگیری را از آن خود کرده است، این کمپانی اخیرا به دستاورد چشمگیر جدیدی دست یافته که میزان دقت نرم افزار تشخیص گفتار را افزایش می دهد. ماه گذشته تیم تحقیق و توسعه این نرم افزار تشخیص گفتار نرخ خطای واژه یا WER را %6.3 اعلام کردند، بدین معنا که از بین تمامی کلماتی که دیکته شده، نرم افزار %93.7 را کاملا درست به ثبت رسانده است. در تست اخیر سیستم تشخیص گفتار این میزان خطا را به %5.9 رساند که کمترین میزان خطایی است که تاکنون توسط چنین سیستم هایی به ثبت رسیده است. به نقل از Xuedong Huang دانشمند ارشد در زمینه گفتار، این میزان دقت با دقت تشخیص گفتار انسان ها برابری می کند.

دقت این سیستم با میزان دقت یک آوانگار حرفه ای برابری می کند و حتی بیشتر از آن می باشد. با این میزان دقت دیگر لازم نیست افراد خود را بیش از حد درگیر تلفظ واضح کلمات برای درک بهتر توسط سیستم نمایند و می توانند با حالت طبیعی خود صحبت کنند، بدین ترتیب در اکثر شرایط نرم افزار آنچه گفته شده است را خواهد فهمید. احتمال می رود که مایکروسافت این سیستم تشخیص گفتار قدرتمند را در کنسول های بازی، گوشی های موبایل و کامپیوترها نیز جای دهد، علاوه بر امکان دارد که از این تکنولوژی جهت ارتقای دقت دستیار هوشمند کمپانی، یعنی Cortana نیز بهره گرفته شود. تست هایی اخیر نتایج بسیار خوب و امیدوارکننده ای را به نمایش گذاشته، اما با این وجود این سیستم نیز مستعد خطاهایی بوده و کاملا دقیق نیست و احتمال دارد گاهی اوقات چند کلمه را جا بیندازد، اما به یقین چنین خطاهایی کمتر از یک شنونده انسانی خواهد بود و همین دستاورد نیز بسیار تاثیرگذار است.

کمپانی های فعال در زمینه تکنولوژی سعی در تسهیل کاربرد سخت افزارهای خود دارند و تشخیص گفتار به یکی از متداول ترین روش هایی تبدیل شده که مشتریان می توانند از طریق آن به تعامل با دستگاه های هوشمند خود بپردازند. برخی از دستگاه ها مانند اسپیکرهای جدید گوگل و Google Home به طور کامل به تشخیص گفتار متکی اند. در حالی که بسیاری از روش های مدرن نسبتا دقیق هستند، پیشرفت های اخیر تعامل با دستگاه ها از طریق صوت را به طور چشمگیری تسهیل می بخشد و گزینه های تعاملی بسیار خوبی را پیش روی کاربران قرار می دهد.

http://www.androidheadlines.com برگرفته از