中華廚具網
    手機版    二維碼   標簽云  廚具企業大全

透視科大訊飛“同傳造假”:機器翻譯之困 技術鴻溝未跨越

2024-05-14 08:58:21 來源:東方財富 作者/編輯: 瀏覽次數:5784 手機訪問 使用手機“掃一掃”以下二維碼,即可分享本文到“朋友圈”中。

【透視科大訊飛“同傳造假”:機器翻譯之困 技術鴻溝未跨越】科大訊飛方面表示,目前機器翻譯已經取得非常大的進步,能夠幫助人們在一些場景中處理語言交流的問題,但距離會議同傳以及高水平翻譯所講究的“信、達、雅”(翻譯中常要求的忠實原文、通順暢達、譯文優美三大原則)還存在很大的差距。(中國經營報)

透視科大訊飛“同傳造假” :機器翻譯之困

近日,人工智能語音領域領軍企業科大訊飛(002230.sz)被曝出“同傳造假”,科大訊飛官方回應這是由于與同傳譯員溝通不足造成的誤會。

據悉,引發此次事件是在2018創新與新興產業發展國際會議上,該會議曾以“機器翻譯”作為宣傳,科大訊飛官方最近解釋稱這種方式是“人機耦合”,并承認機器翻譯仍難以代替人工。

物聯網資深專家楊劍勇對《中國經營報》記者表示,科大訊飛提出人機耦合背后,是智能(機器)翻譯技術相對語音識別技術難度更大。

近年來,隨著ai的熱度遞增,機器翻譯也呈現出爆發之勢。但根據本報記者了解,實際行業現狀是目前機器翻譯仍難以達到接近人類對話的效果,盡管不同企業開始競相研發機器翻譯新品,但如何令翻譯更準確是ai領域待解的一大難題。

技術鴻溝未跨越

曾在臉書擔任軟件實習工程師的王赟,目前在知乎上有6萬關注人次,是語音領域方面的專業答主。王赟告訴記者,“語音識別”是指把聲音轉換成文字的過程,不包括后續的理解、翻譯等。而“同傳”(同聲傳譯)指的是在(識別)一個人說話的同時翻譯成另一種(語言)。

業內普遍認為ai同傳比語音識別更難,只有先識別才能進行翻譯。據了解,搜狗機器同傳技術系統需要將語音預處理、語音識別、文本預處理、機器翻譯、語音合成五項技術模塊進行結合。

中國傳媒大學研究大數據與人工智能方向的教授沈浩認為,目前機器翻譯這方面的技術已經成熟,水平強于(英語)六級,但易受處于近場或遠場、有無噪音等因素影響。

沈浩對本報記者舉例:“如果是日常生活用語,以及標準的一些話語,都沒有問題,但涉及到詩、歌、抒情散文等,翻譯結果容易出現問題。”

北京市速記協會理事長唐可為認為同傳翻譯和速錄都要求精準,速錄員和同傳翻譯在速錄和翻譯過程中要求精簡記錄,進行語義理解后更接近講話者的記錄,而目前的同傳翻譯并不能做到結合上下文完整表達句子意思。

“很多時候,機器速錄、機器翻譯后還需要人為進行實時修改,甚至更考驗速錄員和同傳翻譯,還更耗費時間。”唐可為表示。

搜狗語言交互技術中心技術總監陳偉表示,同傳場景對語音識別的要求很高,錯一個字對于源語言的理解基本不受影響,但若將同傳后的文字翻譯成另一種語言,可能整句都是錯的。

科大訊飛方面則對本報記者表示,目前機器翻譯已經取得非常大的進步,能夠幫助人們在一些場景中處理語言交流的問題,但距離會議同傳以及高水平翻譯所講究的“信、達、雅”(翻譯中常要求的忠實原文、通順暢達、譯文優美三大原則)還存在很大的差距。

盡管有深度學習技術在語音、翻譯等領域的快速突破以及大數據的紅利,但是相比于訓練有素的人工而言,機器實際上缺乏語音識別的穩定性、機器翻譯的穩定性、對語言理解和再創造的能力。

此外,機器同傳要與人工同傳媲美,就要聰明而靈活地結合前后內容進行“創作”。陳偉表示,人工同傳是對譯文二次創造,因此譯文往往流利度高,而機器對于口語化、命名實體和多義詞較多等情況下翻譯效果不夠好,目前(利用機器進行)同傳翻譯仍基于當前單句進行翻譯,上文的歷史信息無法較好使用,以及在語言的理解和再創造的能力方面,目前機器無法基于原文進行引申和擴展,確保翻譯效果的流暢性。

仍具備實際性價值

繼前兩年微軟、百度、騰訊、科大訊飛、谷歌等紛紛推出翻譯軟件、發布翻譯機器后,本報記者梳理發現,今年市面上僅公開發布的產品就有近十款,包括搜狗推出的搜狗旅行翻譯寶、搜狗速記翻譯筆、搜狗錄音翻譯筆記、搜狗翻譯寶pro。華為、360手機、oppo在推出新機時以機器翻譯為賣點,甚至業內一家手機品牌糖果手機直接打出了“翻譯手機”的概念,而獵豹移動也推出了一款小豹ai翻譯棒。

“翻譯機不是高高在上的黑科技,而是通過場景落地,解決用戶在特定場景中需求的真正有用的技術。”獵豹移動ceo傅盛在推出小豹ai翻譯棒時稱。

易觀互動娛樂組群高級殷實告訴本報記者,從商業或者專業會議的角度來看,翻譯機還未能代替人工翻譯在正式場合運用,更多是扮演一個輔助工具角色。“今年來,翻譯技術火爆的原因主要在于它對翻譯精度要求不高場合下有很高的使用價值。”

殷實認為,目前,翻譯機在市場上主要用于在類似出行、旅游等對翻譯精度要求相對低一些的行業,為游客解決在國外語言不通的問題,甚至在一定程度上推動了旅游業的發展。

據易觀千帆的數據,旅游app的月活躍用戶量一年內增長了近30%,國外游的熱度也一直沒有減退。殷實認為,不能因為機器翻譯當下存在問題就否認它存在的價值。

陳偉表示,對比人工同傳和機器同傳的能力,機器相較于人的優勢是:機器基于海量數據能針對某個領域進行快速學習,機器同傳能夠忠實原文,一般不會遺漏譯文,可長時間記憶,機器能夠實現快速、高并發的部署,同時支持多場會議的同傳,很大程度緩解人工同傳資源不足的問題,降低同傳成本。

盡管機器翻譯的發展未完全盡如人意,但是陳偉認為機器翻譯目前滿足部分使用需求的價值已經顯現。近些年,各種規模的國際交流越來越多,從行業大會到閉門小會,甚至到課堂培訓,均存在同傳的需求,而目前雖然有不錯的大量(人工)同傳從業者,但事實上還仍滿足不了國際交流的需求。

沈浩認為,目前機器學習算法的趨勢慢慢接近人工同傳的可靠性,人們應該注重事物未來的發展趨勢。

準確度壁壘待破

本報記者注意到,市場也不乏有眾多聲音稱某某產品語音識別準確率、翻譯準確率能達到多少。就語音識別準確率而言,各家公司自有其說法。

搜狗、百度和科大訊飛三家公司2016年11 月各自宣布其中文語音識別準確率達到了 97%。搜狗稱其語音翻譯的準確率可以達到90%。今年6月,央廣網科技報道稱,目前訊飛輸入法的語音識別準確率提升到98%。近日,科大訊飛方面對本報表示,其機器翻譯已經達到大學六級水平,2019年將達到英語專業八級水平。

王赟告訴本報記者,行業內一般采用“詞錯誤率”進行測評,這個標準主要是看測試所用的“數據集”的難度,不同的數據集難度不同,所以單看一個詞錯誤率的數字,并不能判斷系統性能的好壞。如果要對技術進行測評,必須指明在哪個數據集上取得了這樣的詞錯誤率。王赟舉例表示,在一個叫 switchboard 的數據集上,目前微軟和 ibm 都做到了百分之五點幾的詞錯誤率,已是行業領先。

王赟告訴記者,用標準數據集來測試也有局限性,一些標準數據集里沒有考慮到噪音環境,另外,有團隊可能專注于“刷榜”,把標準數據集上的詞錯誤率刷到很低,但一換成別的數據,就會“現出原形”。

“這也是為什么有些時候一個宣傳得很牛的產品到了實際中就各種不好用。畢竟實際環境是千變萬化的,如果訓練時沒有覆蓋到這么廣的實際場景,在實際中就容易出問題。”王赟向本報記者解釋道。

陳偉告訴本報記者,“現在很多翻譯機的產品,特別是低價的翻譯機更多是從第三方公司獲取,這種情況下很難做二次的優化和開發。”

“根據我們在同傳產品得到的經驗,它并不是簡單的‘語音識別+翻譯’,出現‘1+1>;2’的能力,往往(現實是)遠遠小于2,所以我們要把單點能力做好,同時產生‘1+1=2’甚至遠大于2的效果。這件事情是目前搜狗同傳和搜狗翻譯寶具有的技術壁壘。”陳偉說。

沈浩認為各主要玩家的語音識別準確率已經差別不大,廠商們均掌握著技術原理,只是看哪家能夠不斷地去訓練,對結果進行提升,如準確率從95%提升至96%,但實際上達到95%的準確率時,就可以將其現實化和商業化。“所以判斷他們哪一款產品優秀,我也只能談他們的界面、開源甚至使用成本等其他方面。”沈浩表示。

沈浩表示,從國內外對比上,谷歌能夠實現全球多種語言之間的互譯,而國內企業,例如科大訊飛主要是漢語以及方言的識別,或解決主流使用語言的翻譯。

來源:東方財富

以上是網絡信息轉載,信息真實性自行斟酌。

 
本條標題:透視科大訊飛“同傳造假”:機器翻譯之困 技術鴻溝未跨越
本條信息網址:
文本助手 資訊搜索 分享好友 打印本文 關閉窗口
閱讀關鍵詞
  • 手機瀏覽本文

    手機應用中掃描本文二維碼,即可瀏覽本文或分享到您的社交網絡中。

  • 微信公眾號

    掃描二維碼,關注中華廚具網微信公眾號,實時了解行業最新動態。

版權/免責聲明:
一、本文圖片及內容來自網絡,不代表本站的觀點和立場,如涉及各類版權問題請聯系及時刪除。
二、凡注明稿件來源的內容均為轉載稿或由企業用戶注冊發布,本網轉載出于傳遞更多信息的目的;如轉載稿涉及版權問題,請作者聯系我們,同時對于用戶評論等信息,本網并不意味著贊同其觀點或證實其內容的真實性。
三、轉載本站原創文章請注明來源:中華廚具網

0相關評論
今日熱點文章更多
品牌聚焦更多
推薦品牌更多
熱門頻道
關閉廣告
合作伙伴:
中華廚具網 魯ICP備2021046805號         魯公網安備 37162502000363號 (c)2018-2025SYSTEM All Rights Reserved 投資有風險 加盟需謹慎
關閉廣告
關閉廣告
无码8090精品久久一区| 久久精品国产2020| 影音先锋女人AV鲁色资源网久久 | 国产A三级久久精品| 7777精品久久久大香线蕉| 色综合久久综合中文综合网| 久久久久免费精品国产| 亚洲婷婷国产精品电影人久久| 久久水蜜桃亚洲av无码精品麻豆| 国产高清美女一级a毛片久久w| 国产色综合久久无码有码| 久久久91精品国产一区二区三区| 亚洲七七久久精品中文国产 | 久久狠狠爱亚洲综合影院 | 久久精品国产精品亚洲精品| 国产精品久久久久久久人人看| 女人香蕉久久**毛片精品| 亚洲欧美久久久久9999| 狠狠88综合久久久久综合网| 超级97碰碰碰碰久久久久最新 | 伊人久久大香线蕉精品不卡| 国产精品久久久久影视不卡| 久久久老熟女一区二区三区| 久久精品国产2020| 久久久久久午夜精品| 香蕉久久影院| 久久亚洲国产精品123区| 久久精品国产一区二区| 久久夜色精品国产| 国内精品欧美久久精品| 中文成人无码精品久久久不卡| 久久最新精品国产| 国产精品久久久久影院色| 久久超碰97人人做人人爱| 久久天天躁狠狠躁夜夜网站 | 亚洲人成电影网站久久| 久久精品这里只有精99品| 精品久久久久久无码人妻热| 久久精品成人免费国产片小草| 国产成人无码精品久久久久免费| 丰满少妇人妻久久久久久|