日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當前位置:首頁 > 智能硬件 > 智能硬件
[導讀]而近期搜狗語音交互中心機器翻譯團隊也取得了優(yōu)異的成績,在國際頂級機器翻譯比賽WMT(Workshop on Machine Translation) 2017種獲得人工評測的中英和英中機器翻譯比賽雙向冠軍。

8月初,搜狗CEO王小川的一封內部郵件講到,搜狗即將赴美IPO,也將搜狗帶到了互聯(lián)網(wǎng)圈議論的焦點。

而近期搜狗語音交互中心機器翻譯團隊也取得了優(yōu)異的成績,在國際頂級機器翻譯比賽WMT(Workshop on Machine Translation) 2017種獲得人工評測的中英和英中機器翻譯比賽雙向冠軍。

(WMT機器翻譯比賽得分表,第一個即為搜狗團隊的機器翻譯系統(tǒng))

WMT是機器翻譯領域的國際頂級評測比賽之一,從2006年開始到現(xiàn)在一共舉辦了12屆機器翻譯比賽。它由國際機器翻譯研討會面向新聞領域,提供統(tǒng)一數(shù)據(jù)集,采取機器測評和人工評分兩種測評方式,并將結果以競賽的形式呈現(xiàn)。作為今年新聞機器翻譯任務的7個語言之一,中譯英、英譯中是今年新增的兩個方向,訓練數(shù)據(jù)為800萬~900萬。共有20支團隊提交了中譯英翻譯系統(tǒng)、15支團隊提交了英譯中翻譯系統(tǒng),參賽團隊包括美國約翰霍普金斯大學、美國空軍研究實驗室、加拿大國家研究院、(英)愛丁堡大學、中國中科院計算所、廈門大學等。

搜狗機器翻譯團隊的獲獎代表搜狗在人工智能方面的最新進展,而王小川此前也曾提到今年是搜狗人工智能技術從前沿科技到走向實用的重要一年。那么搜狗前沿技術應用到了哪些領域?在語音交互大入口下又有哪些布局?

智東西同搜狗語音交互中心技術總監(jiān)陳偉以及機器翻譯技術負責人王宇光展開對話,看看這家靠輸入法而知名的公司在人工智能中有哪些新進展。

組建機器翻譯團隊實現(xiàn)跨語言交流

搜狗的核心主要包括兩個事業(yè)部,一個是桌面事業(yè)部,一個是搜索事業(yè)部。陳偉和王宇光所在的語音交互中心則在桌面事業(yè)部下面,而搜狗語音交互中心也是搜狗人工智能技術的代表。

恰逢搜狗在2012年成立語音識別團隊,陳偉便加入了搜狗,而其在博士期間主攻的就是語音識別。目前圍繞語音和輸入法的結合,搜狗輸入法一天的語音識別請求已高達3億次,是國內最大的語音單品APP,也顯示了搜狗在語音識別方面的進展。

除了語音識別之外,圍繞搜狗的人工智能戰(zhàn)略,語音交互中心開始做自然交互。語音技術部圍繞自然交互,逐漸轉移到多模態(tài)輸入上(人機交互中讓機器理解人的信息,包括語音、文本、圖像等方式)。除了語音識別外,語音技術部還做了語音合成、聲紋識別、語音分析(語種)等技術研究,隨著從近場的手機向遠場的電視、音箱發(fā)展,該部門也具有了自己的麥克風陣列的硬件能力,形成了較為閉環(huán)的語音能力。

在這個基礎上,作為一款人與人交流、表達信息的輸入法產品,搜狗希望用戶能夠幫用戶實現(xiàn)跨語言交流,因此就做了機器翻譯,以及基于語音識別和機器翻譯做了搜狗機器的同聲傳譯。

此外,圍繞自然交互,語音技術部也在做手寫和圖像方面的研究,語音+圖像+文本的能力都已具備,在加上語義理解團隊,就是一個完整的知音引擎。未來,搜狗知音也將會成為一個開放平臺,輸出一整套軟硬件相結合的語音交互方案,并將逐漸把搜狗知音OS的能力標準化,輸出到最適合的場景。

依托數(shù)據(jù)優(yōu)勢構建機器翻譯技術壁壘

而本次WMT比賽中獲獎的機器翻譯團隊也在語音技術部下。隨著2014年機器翻譯從SMT(統(tǒng)計機器翻譯)往NMT(神經(jīng)網(wǎng)絡機器翻譯)遷移,搜狗語音技術部門便做基于神經(jīng)網(wǎng)絡技術的機器翻譯,并在2016年成立機器翻譯團隊。

機器翻譯團隊從一開始就發(fā)力神經(jīng)機器翻譯技術,用了不到半年的時間把技術打磨好,使用在搜狗輸入法上,輸入法中的語音翻譯和文本翻譯上線以來日均請求量已達200萬次。之后在去年11月份世界互聯(lián)網(wǎng)大會上,語音技術部便將已有的語音技術和機器翻譯技術相結合,推出了機器同傳技術,目前已經(jīng)在多場重要會議場中使用。

以中英文的機器同傳為例,它大致需要將搜集來的中文語音信息經(jīng)過語音斷句,獲得小的語音片段,然后會送到語音識別中獲得文本,此時需要對文本進行一些順滑處理,將這個經(jīng)過語音識別后的處理文本送到端到端的神經(jīng)網(wǎng)絡(目前機器翻譯的主流方法),通過翻譯器進行語音翻譯。

在機器翻譯中,各家公司使用的算法類型基本是一樣的,但是同樣的數(shù)據(jù)效果卻相差很多。對于搜狗來講,重要的問題有兩個,一個是怎么用好數(shù)據(jù)(比如單語數(shù)據(jù)),另一個是找到最合適的數(shù)據(jù)(甄選數(shù)據(jù))。此外,搜狗機器翻譯團隊也在針對翻譯里面的實體進行優(yōu)化,包括多翻漏翻、數(shù)字等細節(jié)問題。

那么剛剛成立1年多的機器翻譯團隊,相比其他機器翻譯團隊、或者科大訊飛,搜狗的優(yōu)勢何在?智東西了解到,一方面是人才,搜狗主做機器翻譯的員工經(jīng)驗大都在5年以上;第二,語音識別中有許多經(jīng)驗可以借鑒,依托于之前語音團隊的技術優(yōu)勢,對機器翻譯幫助也很大;第三,搜狗在輸入法的場景下面積累大量的用戶數(shù)據(jù),可以快速把數(shù)據(jù)壁壘做起來,而算法是很難形成壁壘的。

2012年之后,原有統(tǒng)計機器翻譯上的技術框架逐漸被推倒,需要從新布局新的技術框架。再加上搜狗有國內最大的輸入法,在這方面積累的語音數(shù)據(jù)量比科大訊飛還要多。難怪陳偉稱搜狗在機器翻譯方面與科大訊飛是持平的或是有優(yōu)勢的。

就機器同傳而言,目前搜狗的語音識別率已達97%,而機器翻譯的準確率則要略低一些,這也是業(yè)界的難題。機器翻譯最難的部分在于盲傳,翻譯本身是嚴重依賴上下文的,而機器翻譯卻沒有任何背景知識。此外機器同傳也要盡可能的做到低延遲,搜狗在這方面已經(jīng)把延遲控制在2、3秒以內。

而搜狗機器同傳接下來的發(fā)展,一方面需要保證穩(wěn)定的語音識別率,比如噪音場景下;另一方面是機器翻譯如何能更好的找到一個完整的語譯邊界。同傳系統(tǒng)最核心的就是建立一個連接語音識別和機器翻譯文本的處理系統(tǒng),這個處理系統(tǒng)可以接收語音識別的結果,去做容錯。此外,就是如何處理更多口語化的表達,如“這個”、“那個”,以及如何斷句問題,確保翻譯出來的是一個完成的語義句子。當這些問題都解決的時候,機器同傳的效果才會提升很多。

結語:搜狗語音交互入口下的布局

機器翻譯是搜狗重點布局的一個方向,也是一個差異化的優(yōu)勢所在。但搜狗的人工智能并未止步于此,圍繞著語音交互入口,搜狗在更多領域,甚至在智能硬件方面都會有進一步的進展。目前搜狗技術落地的產品主要包括搜狗輸入法、搜狗同傳、搜狗聽寫等產品。

在2014年前后,搜狗也做過手機中的語音助手APP,但后來項目被停滯。搜狗也從中獲取經(jīng)驗,“一個產品做的好不好,要看你的產品邊界定的清不清楚,技術能力能不能達到產品需求”。在這種情況下,搜狗將深耕車載和家居兩個方向的語音交互。

目前搜狗在和四維圖新做車載設備中的人機交互,跟小米電視、創(chuàng)維電視等合作打磨語音交互技術,預計未來將會有更多打造搜狗語音技術的智能硬件產品發(fā)布。

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內容真實性等。需要轉載請聯(lián)系該專欄作者,如若文章內容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

LED驅動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關鍵字: 驅動電源

在工業(yè)自動化蓬勃發(fā)展的當下,工業(yè)電機作為核心動力設備,其驅動電源的性能直接關系到整個系統(tǒng)的穩(wěn)定性和可靠性。其中,反電動勢抑制與過流保護是驅動電源設計中至關重要的兩個環(huán)節(jié),集成化方案的設計成為提升電機驅動性能的關鍵。

關鍵字: 工業(yè)電機 驅動電源

LED 驅動電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個照明設備的使用壽命。然而,在實際應用中,LED 驅動電源易損壞的問題卻十分常見,不僅增加了維護成本,還影響了用戶體驗。要解決這一問題,需從設計、生...

關鍵字: 驅動電源 照明系統(tǒng) 散熱

根據(jù)LED驅動電源的公式,電感內電流波動大小和電感值成反比,輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關鍵字: LED 設計 驅動電源

電動汽車(EV)作為新能源汽車的重要代表,正逐漸成為全球汽車產業(yè)的重要發(fā)展方向。電動汽車的核心技術之一是電機驅動控制系統(tǒng),而絕緣柵雙極型晶體管(IGBT)作為電機驅動系統(tǒng)中的關鍵元件,其性能直接影響到電動汽車的動力性能和...

關鍵字: 電動汽車 新能源 驅動電源

在現(xiàn)代城市建設中,街道及停車場照明作為基礎設施的重要組成部分,其質量和效率直接關系到城市的公共安全、居民生活質量和能源利用效率。隨著科技的進步,高亮度白光發(fā)光二極管(LED)因其獨特的優(yōu)勢逐漸取代傳統(tǒng)光源,成為大功率區(qū)域...

關鍵字: 發(fā)光二極管 驅動電源 LED

LED通用照明設計工程師會遇到許多挑戰(zhàn),如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。

關鍵字: LED 驅動電源 功率因數(shù)校正

在LED照明技術日益普及的今天,LED驅動電源的電磁干擾(EMI)問題成為了一個不可忽視的挑戰(zhàn)。電磁干擾不僅會影響LED燈具的正常工作,還可能對周圍電子設備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來解決L...

關鍵字: LED照明技術 電磁干擾 驅動電源

開關電源具有效率高的特性,而且開關電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機重量也有所下降,所以,現(xiàn)在的LED驅動電源

關鍵字: LED 驅動電源 開關電源

LED驅動電源是把電源供應轉換為特定的電壓電流以驅動LED發(fā)光的電壓轉換器,通常情況下:LED驅動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關鍵字: LED 隧道燈 驅動電源
關閉