眾所周知,數(shù)據(jù)對于人工智能產(chǎn)業(yè)的重要性就如同石油之于工業(yè)一樣。傳統(tǒng)的人工智能數(shù)據(jù)生產(chǎn)過程是人工采集標(biāo)注大量的數(shù)據(jù)給機(jī)器去學(xué)習(xí),這樣的處理數(shù)據(jù)方式是高成本的,低效率的,并且無法大規(guī)模生產(chǎn)的。
數(shù)據(jù)堂自主研發(fā)的“human-in-the-loop人在回路”的技術(shù)應(yīng)用到人工智能數(shù)據(jù)生產(chǎn)中后,可以將人工的采集標(biāo)注與智能工具標(biāo)注相互迭代,融為一體,從而顯著提高數(shù)據(jù)生產(chǎn)效率,降低生產(chǎn)實(shí)施成本,擴(kuò)大產(chǎn)能。(完整視頻請搜索:數(shù)據(jù)堂“human-in-the-loop”智能數(shù)據(jù)工廠)
簡單來說,human in the loop數(shù)據(jù)處理過程是:人處理的數(shù)據(jù),教給機(jī)器學(xué)習(xí),機(jī)器將學(xué)習(xí)的結(jié)果反饋給人工進(jìn)行校對,持續(xù)提升準(zhǔn)確率。當(dāng)最后有大量的原始數(shù)據(jù)給機(jī)器的時(shí)候,機(jī)器便可以很快的處理,直接提供出結(jié)果數(shù)據(jù)。
車輛檢測
半監(jiān)督深度學(xué)習(xí)的圖像分割數(shù)據(jù)標(biāo)注技術(shù),可以有效提高無人駕駛標(biāo)注數(shù)據(jù)集的生產(chǎn)效率,實(shí)現(xiàn)精確的目標(biāo)檢測和像素級分割,并半自動(dòng)地完成上百個(gè)屬性的標(biāo)注。這樣無人駕駛數(shù)據(jù)的生產(chǎn)方式,才能滿足國內(nèi)外日益增長的智能無人車市場需求。
199 >
文字識(shí)別
也稱為ocr,數(shù)據(jù)堂基于半監(jiān)督深度學(xué)習(xí)的文字識(shí)別技術(shù),通過注入海量標(biāo)注數(shù)據(jù)做預(yù)訓(xùn)練,并伴隨人工的監(jiān)督性學(xué)習(xí),可以明顯提高ocr標(biāo)注數(shù)據(jù)集的質(zhì)量,提升ocr標(biāo)注數(shù)據(jù)產(chǎn)品生產(chǎn)效率。
199 >
語音識(shí)別
自語音識(shí)別技術(shù)進(jìn)入深度學(xué)習(xí)時(shí)代,語音識(shí)別準(zhǔn)確率突飛猛進(jìn)。數(shù)據(jù)堂半監(jiān)督深度學(xué)習(xí)的語音識(shí)別數(shù)據(jù)標(biāo)注技術(shù),利用kaldi識(shí)別引擎對語音數(shù)據(jù)做預(yù)識(shí)別和自然語言輔助糾錯(cuò),再加上人工的監(jiān)督性校對,可以顯著提高語音識(shí)別標(biāo)注數(shù)據(jù)集質(zhì)量。
199 >
人臉檢測
人臉檢測常用的數(shù)據(jù)集,包括fddb、aflw、wider face等。應(yīng)用人機(jī)交互式的標(biāo)注技術(shù),將人臉預(yù)識(shí)別結(jié)果通過人機(jī)交互式修正,如此往復(fù),可以有效提高數(shù)據(jù)處理速度,人臉關(guān)鍵點(diǎn)標(biāo)注數(shù)據(jù),從68點(diǎn)快速過渡到95點(diǎn)、106點(diǎn)、202點(diǎn)等,有效降低人工成本。
199 >
視頻追蹤
視頻追蹤是也是當(dāng)下人工智能技術(shù)研究的重點(diǎn)方向,數(shù)據(jù)堂視頻目標(biāo)跟蹤數(shù)據(jù)標(biāo)注技術(shù),通過人機(jī)交互、過程糾偏、自學(xué)習(xí)反饋機(jī)制,實(shí)現(xiàn)近乎逐幀的目標(biāo)對象框選、主體id對齊、顯現(xiàn)片段等,有效解放人工操作,進(jìn)而降低生產(chǎn)成本、提高數(shù)據(jù)質(zhì)量。
198 >
數(shù)據(jù)堂跟蹤統(tǒng)計(jì)結(jié)果表明,“human in the loop”技術(shù)的應(yīng)用,使數(shù)據(jù)處理的效率平均提升25%以上,數(shù)據(jù)堂堅(jiān)信智能數(shù)據(jù)處理工具的普及將帶來的不僅僅是ai數(shù)據(jù)產(chǎn)業(yè)的提升更是整個(gè)ai產(chǎn)業(yè)革命性的創(chuàng)新。
數(shù)據(jù)堂的ai開放實(shí)驗(yàn)室目前已聚集數(shù)位人工智能數(shù)據(jù)科學(xué)家。專注于多模態(tài)數(shù)據(jù)采集、大數(shù)據(jù)處理、人工智能數(shù)據(jù)標(biāo)注加工等方面的研究。我們歡迎更多的伙伴加入我們,數(shù)據(jù)堂有海量的數(shù)據(jù)和訓(xùn)練集群,我們希望有更多的算法和調(diào)優(yōu)技巧的融入,讓我們共建智能數(shù)據(jù)工廠,助力ai產(chǎn)業(yè)創(chuàng)新。
關(guān)于數(shù)據(jù)堂
來源:網(wǎng)絡(luò)
以上是網(wǎng)絡(luò)信息轉(zhuǎn)載,信息真實(shí)性自行斟酌。