日前,微軟語音識別技術(shù)27年老將、微軟首位華人技術(shù)院士黃學(xué)東擔(dān)任微軟全球人工智能首席技術(shù)官,全面負(fù)責(zé)微軟azure云人工智能的工作,包括語音、機器翻譯、計算機視覺、自然語言和人工智能認(rèn)知服務(wù)。
根據(jù)最新任命,黃學(xué)東(技術(shù)fellow,現(xiàn)為ai認(rèn)知服務(wù)首席技術(shù)官)將領(lǐng)導(dǎo)新統(tǒng)一的ai認(rèn)知服務(wù)工程和研究團隊。黃學(xué)東最近領(lǐng)導(dǎo)了認(rèn)知組織的語音和語言團隊,是ai領(lǐng)域全球頂尖專家之一。認(rèn)知組織中的語音和語言以及計算機視覺團隊將移至ai平臺并向黃學(xué)東匯報,而ai平臺組織中現(xiàn)有的form recognizer,personalizer和其他認(rèn)知服務(wù)工程團隊也將向黃學(xué)東匯報。
首先我們要祝賀黃學(xué)東博士,我們期待微軟ai在黃學(xué)東博士的帶領(lǐng)下再創(chuàng)佳績!接下來先為大家介紹一下黃學(xué)東博士。
微軟語音技術(shù)創(chuàng)始人,微軟首位華人技術(shù)院士
微軟素有ai領(lǐng)域“黃埔軍校”的美譽,而微軟全球技術(shù)院士代表著技術(shù)人員的最高榮譽,到現(xiàn)在,全球也僅有20多人獲得這項殊榮,其中就包括黃學(xué)東,微軟首位華人技術(shù)院士、微軟首席語音科學(xué)家。
黃學(xué)東
1978年,15歲的黃學(xué)東進(jìn)入湖南大學(xué)師資班(后來的電子工程系),成為當(dāng)時校園里年齡最小的學(xué)生之一。他先后獲得湖南大學(xué)學(xué)士學(xué)位、清華大學(xué)碩士學(xué)位和英國愛丁堡大學(xué)博士學(xué)位。
1993年,他作為高級研究員加入了微軟研究所并負(fù)責(zé)組建microsoft's 語音識別技術(shù)研究團隊。2000年到2004年,他作為microsoft's語音識別技術(shù)研究團隊的總經(jīng)理,負(fù)責(zé)微軟語音技術(shù)和產(chǎn)品的研究、開發(fā)和市場拓展。
作為微軟的首席語音科學(xué)家,黃學(xué)東率領(lǐng)團隊實現(xiàn)了 ai 超越人類水平的歷史性里程碑:
2016年10月18日,由黃學(xué)東帶領(lǐng)的微軟語音團隊在產(chǎn)業(yè)標(biāo)準(zhǔn) switchboard 語音識別基準(zhǔn)測試中,實現(xiàn)了對話語音識別詞錯率(word error rate, 簡稱wer)低至5.9%的突破,首次達(dá)成與專業(yè)速記員持平而優(yōu)于絕大多數(shù)人的表現(xiàn)。“這是人工智能領(lǐng)域突破性進(jìn)展之一,意味著有史以來第一次有計算機能像人類一樣,識別對話中的每一個單詞。”黃學(xué)東說。
2017年,在對話語音轉(zhuǎn)寫任務(wù)中,微軟語音識別系統(tǒng)的詞錯率降到 5.1%,準(zhǔn)確率超過專業(yè)速記員。“可能表面上這個進(jìn)展不大,但是在‘最后一英里’上,每 0.1 個百分點的進(jìn)步都很艱難,必須保證系統(tǒng)沒有任何bug。何況從相對錯誤率降幅角度, 5.9 到 5.1 是一個超過 10% 的相對進(jìn)步。”
2018 年,在漢英新聞機器翻譯任務(wù)中,微軟機器翻譯系統(tǒng)達(dá)到了可與人工翻譯媲美的水平。
2019 年,在斯坦福對話式問答任務(wù)中,微軟機器閱讀理解系統(tǒng)刷新記錄,成為目前排行榜上唯一一個模型分?jǐn)?shù)超過人類分?jǐn)?shù)的團隊。
對話微軟黃學(xué)東:語音和語言技術(shù)是真正鑲在ai皇冠上的明珠
“只有掌握了核心的語音和語言技術(shù),人工智能才有希望,否則其它都是在‘忽悠’。”黃學(xué)東認(rèn)為,在人工智能發(fā)展的過程中,語音和語言是皇冠上的明珠。
去年,黃學(xué)東做客微軟播客節(jié)目,聊了聊他和團隊在語音和語言技術(shù)取得的幾個里程碑式的突破。
黃學(xué)東解釋了掌握語音識別、翻譯和對話將如何讓機器從 “感知 ai” 進(jìn)化到 “認(rèn)知 ai”,更接近真正的人類智能。此外,黃學(xué)東也談到他如何走上語音研究之路,以及他在清華大學(xué)和在微軟的人生歷程。
主持人:您是微軟語音和語言組的 technical fellow,負(fù)責(zé)領(lǐng)導(dǎo)微軟的語音工作。我們將在稍后深入討論這些,但首先,作為公司的首席語音科學(xué)家,請概括地告訴我們你的工作內(nèi)容是什么,以及為什么要做這些。你早上起來的動力是什么?
黃學(xué)東:我們所做的就是確保我們擁有最好的語音和語言技術(shù),可以用于各種各樣的場景。我們有一整個團隊在做這件事情,因為對話不僅是人們最自然的交流方式,而且這是 ai 最大的挑戰(zhàn)。我們嘗試真正地推動這個領(lǐng)域的突破,在我們的云服務(wù) azure services 上提供出色的服務(wù),并確保我們能夠讓微軟內(nèi)部和微軟之外的客戶滿意。如果你想厘清整個事情,主要有三個方面。
首先,我們有能力去真正提高語音識別的準(zhǔn)確性,去驅(qū)動語音合成的自然性,以及確保機器翻譯的準(zhǔn)確性,例如從英語翻譯成漢語或法語或德語。因此,這背后有很多科學(xué),要確保準(zhǔn)確性,自然度,延遲時間,這些技術(shù)都是世界級的。這是一方面。
第二方面是,我們不僅提供技術(shù),我們還通過 azure 提供服務(wù)。從 office 到 windows, cortana,它們都依賴于相同的云服務(wù)。我們也有邊緣設(shè)備,比如我們的語音設(shè)備 sdk。我們想要確保在邊緣和云端的語音技術(shù)都是以現(xiàn)代的方式提供的,即云平臺和嵌入式平臺。這是第二方面:平臺是現(xiàn)代化的。
第三個方面,是向客戶表達(dá)我們的愛。因為我們在世界各地都有廣泛的客戶,我們想讓消費者滿意,并確保使用我們的語音翻譯的客戶體驗是一流的。
這就是我實際上在做的三件關(guān)鍵事情:提升 ai 能力,使我們在云端和邊緣設(shè)備的平臺實現(xiàn)現(xiàn)代化,以及愛我們的客戶。
在人類進(jìn)化的長河中語音和語言起了決定性的作用,在ai的進(jìn)化中也會如此
在2018年新智元產(chǎn)業(yè)·躍遷技術(shù)峰會上,黃學(xué)東分享了微軟在語音、自然語言和機器翻譯研究中不斷“開掛”的歷程和技術(shù)細(xì)節(jié)。黃學(xué)東說,人類進(jìn)化的長河中語音和語言起了決定性的作用,在人工智能的進(jìn)化當(dāng)中語音和語言會起到同樣的作用。
黃學(xué)東
黃學(xué)東談到:達(dá)爾文的進(jìn)化論已經(jīng)說明,最新的科學(xué)驗證也再次證明,我們?nèi)撕痛笮尚蒬na的相似度接近99%,就那1%的區(qū)別造就了我們是這個地球的主宰。為什么呢?因為我們更聰明嗎?還是漫長的進(jìn)化過程當(dāng)中有什么其他因素?計算機視覺非常重要,但動物的視力其實比人還厲害,晚上的夜貓子看得比人更厲害,但我們?nèi)匀皇沁@個地球的主宰,最重要的原因之一是我們的語音和語言。
2020,新智元繼續(xù)與您一起探索????于你的ai新天地!ai技術(shù)干貨,b站風(fēng)格直播,就在新智元we站小程序!ai????你,新智元祝您2020新春快樂!????????
來源:新浪網(wǎng)
以上是網(wǎng)絡(luò)信息轉(zhuǎn)載,信息真實性自行斟酌。