近日, 中科院合肥研究院智能所先進(jìn)制造技術(shù)研究中心王紅強(qiáng)研究員團(tuán)隊(duì)提出了一種新型目標(biāo)檢測(cè)人工智能框架,為快速高精度實(shí)時(shí)在線目標(biāo)識(shí)別提供了新的解決方案。相關(guān)工作發(fā)表在計(jì)算機(jī)科學(xué)及工程技術(shù)領(lǐng)域頂刊 expert systems with applications 上。
近年來,深度學(xué)習(xí)理論驅(qū)動(dòng)了人工智能技術(shù)飛躍式發(fā)展,基于深度學(xué)習(xí)的目標(biāo)檢測(cè)技術(shù)在許多產(chǎn)業(yè)應(yīng)用中取得巨大成功,其中快速實(shí)時(shí)目標(biāo)檢測(cè)是人工智能技術(shù)產(chǎn)業(yè)應(yīng)用的重要需求。一直以來快速實(shí)時(shí)目標(biāo)檢測(cè)研究主要依賴研發(fā)輕量型神經(jīng)網(wǎng)絡(luò)模型(或邊緣計(jì)算等)提高目標(biāo)檢測(cè)速度,但效率與精度往往不能兼顧,成為當(dāng)前目標(biāo)檢測(cè)前沿研究與產(chǎn)業(yè)應(yīng)用的重要挑戰(zhàn)之一。此外,由于深度學(xué)習(xí)自身的特性, 檢測(cè)精度再提升往往伴隨著巨大的計(jì)算代價(jià)和時(shí)間開銷, 造成在許多場(chǎng)景下部署和再升級(jí)瓶頸。
科研團(tuán)隊(duì)通過研究分析發(fā)現(xiàn),基于深度學(xué)習(xí)的目標(biāo)檢測(cè)技術(shù)主要缺陷之一在于重復(fù)的特征提取與融合深度網(wǎng)絡(luò)結(jié)構(gòu),產(chǎn)生不必要的計(jì)算代價(jià)。為此,科研人員提出一種多輸入單輸出目標(biāo)識(shí)別框架(miso),區(qū)別于傳統(tǒng)的多輸入多輸出模式,具有降低模型復(fù)雜度與推理時(shí)間開銷的巨大潛力。同時(shí),在此框架下,科研團(tuán)隊(duì)基于早期提出的erf檢測(cè)理論,設(shè)計(jì)了感受野調(diào)節(jié)機(jī)制、殘差注意力自學(xué)習(xí)機(jī)制、基于erf動(dòng)態(tài)平衡抽樣策略三種新的學(xué)習(xí)機(jī)制,實(shí)現(xiàn)了更加簡潔高效地提取熱點(diǎn)特征信息。在標(biāo)準(zhǔn)數(shù)據(jù)集上以同樣29fps的速率下獲得高出現(xiàn)有基準(zhǔn)2.6個(gè)百分點(diǎn),驗(yàn)證了該模型的優(yōu)越性。該方法為目標(biāo)檢測(cè)前沿研究與產(chǎn)業(yè)應(yīng)用提供了新的思路。
來源:中科院合肥研究院
以上是網(wǎng)絡(luò)信息轉(zhuǎn)載,信息真實(shí)性自行斟酌。