(文章來源:曉芯智能語音)
? ? ?? 語音識別作為打造良好交互體驗的重要前提,今年的發(fā)展可謂是持續(xù)火爆。在智能音箱市場,令人首先想到的就是Amazon的Echo。Echo作為將自然語音轉化為在線指令的設備,其效率之高毋庸置疑,并且可保持在線的自然環(huán)境中的自然語言識別。
而國內語音識別領域也開始爭奪大戰(zhàn)。以科大訊飛聽見系列產品為例,自2015年發(fā)布以來,總用戶突破1000萬,應用于30余個行業(yè)。目前,已經形成了以聽見智能會議系統(tǒng)、訊(詢)問筆錄系統(tǒng)、聽見轉寫網站、錄音寶APP、聽見智能會議服務等以智能語音轉寫技術為核心的產品和服務體系。
曉芯電話機器人就是基于語音識別技術的一種應用產品。曉芯智能以服務低端勞力密集型企業(yè)為宗旨,幫助企業(yè)突破人工客服效率低、工作時間長的瓶頸,從而幫助企業(yè)擴大規(guī)模和提升業(yè)績。
我們所期望的語音識別實質上是人機交互,大致上可以理解為人與機器之間無障礙溝通。在通信側音源質量限制的情況下,曉芯機器人在對音源質量通過算法進行智能降噪以及通信側持續(xù)優(yōu)化之后,仍然能以80%的識別率達到行業(yè)領先的水準。但即便是達到100%也還是沒有實現真正的人機交互
而我們曉芯電話機器人有很多的客戶都問我們能不能達到語義識別?
目前來說確實不能,要從語音識別成功轉變成真正意義上的語義識別,在智能電話客服的技術實現上依舊存在難點,大量的多音字和同音詞是干擾機器人識別精準度的的主要障礙。首先要獲得大量的數據,用這些數據不斷訓練,來提高識別的準確率。這一步的跨越還存在多種難關要攻克。就目前的市場分析來看,語義識別只是慢慢滲透到我們的生活中,還沒有成熟的在行業(yè)中應用自如。隨著技術不斷地成熟,曉芯智能也必定會將語義識別技術融合進曉芯電話機器人。
語義識別的三個層次,1、應用層:包括行業(yè)應用和智能語音交互系統(tǒng),2、NLP技術層:包括以語言學、計算機語言等學科為背景的,對自然語言進行詞語解析、信息抽取、時間因果、情緒判斷等等技術處理,最終達到讓計算機“懂”人類的語言的自然語言認知,以及吧計算機數據轉化為自然語言的生成。3、底層數據層:詞典、數據集、語料庫、知識圖譜,以及外部世界常識性知識等都是予以是被算法木星的基礎。
語義識別技術可以分析網頁、文件、郵件、音頻、論壇、社交媒體中的大亮數據,應用領域廣泛,既可以直接應用與醫(yī)療、教育、金融等行業(yè)。也可以通過技術接口應用于所有智能語音交互場景,如智能家居、車載語音、可穿戴設備、VR、機器人等,從交互的方式上,也可以分為:事實問答、知識檢索、分類問題等。智能語音交互被看做未來人工智能技術中最值得期待的應用場景。
人工智能作為國家戰(zhàn)略發(fā)展規(guī)劃之一,足見其重要性。在這個政策的驅動下,各種資源包括國家型自然科學基金、產業(yè)基金、地方政府財稅優(yōu)惠政策、人工智能相關實驗室、科技產業(yè)園區(qū)等切實促進人工智能的發(fā)展落地,為自動駕駛、計算機視覺、語音/語義識別創(chuàng)業(yè)提供了更好的條件和基礎設施。





