“中國將成為人工智能領域的領頭羊”,李開復2015年曾說過。
如今三年過去,在全球正在經歷的新一輪科技和產業革命中,以科技創新尋求高質量發展的中國在人工智能領域逐漸實現了“領跑”。
10月29日,云從科技宣布在語音識別技術上取得重大突破,在全球最大的開源語音識別數據集librispeech上刷新了世界紀錄,錯詞率(worderrorrate,wer)降到了2.97%,將librispeech的wer指標提升了25%,超過阿里、百度、約翰霍普金斯大學等企業及高校,大幅刷新原先記錄。
機器視覺、智能語音的跨界秀
中國人工智能領跑背后,部分應用技術快速成熟,已進入實用階段。機器視覺、智能語音成為產業化水平最高的人工智能領域。
打破語音識別世界紀錄的云從科技其實是以機器視覺起家。今年2月,云從科技國內首發3d結構光技術;4月,跨鏡追蹤技術(reid)技術在market-1501,dukemtmc-reid,cuhk03三個數據集刷新了世界紀錄,其中最高在market-1501上的首位命中率(rank-1 accuracy)達到96.6%,讓跨鏡追蹤技術(reid)技術在準確率上首次達到商用水平,僅憑穿著、姿態等就可認知行人。
從「刷臉」到「識人」,從「機器視覺」到「智能語音」,云從上演了一場精彩的跨界秀。
人工智能核心技術閉環“三部曲”
頻頻跨界,看似意外,卻是計劃之中。云從創始人周曦曾提出人工智能要營造核心技術閉環,在“人臉識別”之后向基于圖像、語音、文字識別的智能感知以及基于大數據的智能分析階段邁進。
“云從科技初始來說就是人臉識別的公司,打造人工智能的眼睛;有了眼睛,下一步我們就要做五官,就是人機交互,我們叫感知。再往后做它的大腦,就是認知和決策,就是腦科學。”
語音識別突破屬于智能感知中的重要一環。通過語音識別,機器就可以像人類一樣聽懂說話,進而能夠理解、思考與反饋。近年來,在深度學習技術的幫助下,語音識別取得了極大的進展,從實驗室開始走向市場,走向實用化。基于語音識別技術的輸入法、搜索和翻譯等人機交互場景都有了廣泛的應用。
人工智能“五步走”戰略
從人臉識別技術切入,到智能感知技術逐個突破,人工智能技術內部正在完成一項大的融合,這也是人工智能企業已經認識到的,人工智能要向智能生態邁進。
在10月12日的國家發改委“人工智能基礎資源公共服務平臺”項目發布會上,云從科技創始人周曦提出了人工智能發展的五個階段。
基于核心技術閉環,并在金融、安防、機場等優勢行業建設基于智能分析的“行業大腦”,穩步推進從核心技術到智能生態的五步走戰略。
目前,云從科技是中國銀行業第一大ai供應商。包括農行、建行、中行、招行總行等全國400多家銀行已采用公司產品,為全國銀行提供對比服務日均2.16億次,同時為14.7萬家社會網點提供服務。
在安防領域,公司產品已在29個省級行政區上線實戰,每天比對超過10億次,數據匯聚總量超過千億,協助全國公安抓獲超過1萬名犯罪嫌疑人;
來源:網絡
以上是網絡信息轉載,信息真實性自行斟酌。