自從神經網絡在2012年重新開始復興以來,計算機視覺一直是人工智能研究人員研究和創新的成熟領域,也是企業應用人工智能的一個富有成效的領域。深度學習可實現令人難以置信的機器視覺功能,例如在人類奇偶校驗中對圖像主體進行分類并動態生成全新的圖像。
400 >
品牌很快將這項技術視為商業資產。clarifai是一家領先的計算機視覺公司,擁有流行的視覺智能api,最近用于分析棒球比賽期間數百張球迷的照片,以確定他們何時接球。然后,洞察力被覆蓋在體育場座位圖上,以顯示希望帶回家紀念品捕獲的粉絲的最高概率席位。從業務角度來看,此類數據可以推動更有效的分層定價。
同樣的技術同樣適用于暴雪娛樂公司制作的流行紙牌游戲“爐石傳說”。通過觀看多輪比賽,ai學習了游戲的牌和策略,并可以提供逐個游戲的評論。在黑客馬拉松期間,開發人員將clarifai的可視化api用于另一個目的:tinder刷卡。這些算法學會了其中一個開發人員的偏好并接管了為他掃描的費力行為。
“這里的共同主題是定制,”clarifai創始人兼首席執行官matthew zeiler解釋道。“無論你想要識別什么,你都可以教平臺,這一直適用于大公司。”事實上,許多尋求更快的照片搜索和分類方法的大公司都在注意。數字媒體巨頭buzzfeed采用了視覺智能,以幫助編輯找到相關的文章照片。另一個clarifai的客戶,“自然美”的支持者,使用視覺智能來識別來自未穿著化妝品的時尚女性的社交媒體的例子,體現了他們的品牌信息。
zeiler和他在clarifai的團隊并不是唯一一個依賴視覺智能潛力的人。google,ibm,salesforce和microsoft等主要廠商以及gumgum和ditto等小型企業都提供計算機視覺解決方案。例如,google cloud vision api使用戶可以輕松整理存儲的照片。亞馬遜的版本rekognition面向希望為應用添加面部識別安全性或記錄觀眾人口統計數據的開發人員。gumgum的優惠針對的是有興趣使用社交媒體帖子在線監控品牌代表或從體育賽事視頻中計算獲得的媒體的公司。zeiler表示,視覺識別的一大承諾是“下一級分析,展示您的產品如何在世界范圍內使用”。
挑戰仍然存在,尤其是品牌數據。例如,許多零售商都有針對白色背景的產品目錄照片。雖然可以訓練算法以在消毒條件下識別這些產品,但是在真實場景中識別相同的鞋將需要更多的訓練數據。zeiler表示,未來的關鍵是“它不會是收集這些數據的ai專家 - 它將成為地球上的每個人。”為了促進這一點,他和他的團隊正在使他們的技術廣泛采用和用戶 - 盡可能友好地“讓每個人都互動”。
另一個挑戰是缺乏高分辨率圖像,這對某些應用至關重要。許多品牌都在呼吁人工智能解決方案進行自動偽造檢測。假冒產品和真品之間的差異往往非常微妙,例如錢包扣或鞋帶上的輕微變化,并且在低分辨率照片中可能無法檢測到。很多時候,人眼檢測到的差異甚至很難。
zeiler還認為,多模態神經網絡 - 即可以并行處理多種不同媒體類型的網絡,如音頻,視頻和文本 - 是下一個需要關注的創新。“融合多種數據類型很困難,”他指出,“多功能神經網絡的表現不如單一數據。”但是,同時分析產品的多個方面具有非凡的價值,例如:圖像,描述,價格,用戶評論以及用戶生成的圖像和視頻。zeiler希望一次處理多達10種模態。
雖然科技巨頭一直在搶購像orbeus,alchemy和metamind這樣的ai創業公司以趕上ai戰爭,但zeiler認為對客戶需求的專注承諾將幫助clarifai保持競爭優勢。“谷歌生產互聯網氣球,自動駕駛汽車,文字處理器,電子郵件客戶端,當然還有搜索和廣告產品。如此多的部門,他們與客戶競爭。“如果廣告客戶將其專有數據視為關鍵的防御優勢,他們可能會猶豫是否將這些數據發送到google的云端。同樣,亞馬遜可以從其他零售商的數據中學習并直接與他們競爭。
來源:網絡
以上是網絡信息轉載,信息真實性自行斟酌。