2019年6月5日,全球人工智能行業高速發展,ai正在通過“數據+算力+算法+場景”的疊加效應,幫助企業更好地決策,將復雜的分析嵌入到日常的工作和交易場景中,使日益復雜的工作變得更加自動化,提高財資工作效率,從而直接改變和衍生出更多的商業模式和應用場景。
但人工智能公司鎂光燈下展現的更多的是愿景、場景、算法、模型。卻鮮有公司呈現自己的數據能力。其實,在算法和模型的差異性比較小,而識別度和準確度的差別,直接影響到一家人工智能公司的“智能程度”。
數據獲取能力不僅拼資本,更拼行業關系
中國市場主要的人工智能公司,例如商湯科技、曠視科技、地平線等,包括百度、阿里、騰訊等傳統互聯網平臺公司,獲取數據的方式主要是通過獲得國家頒發的牌照,自己購置設備進行采集;傳統互聯網公司在數據采集部分擁有一定程度的先發優勢,基于原有的大量用戶和終端,可以比較容易的獲得一些通用數據,但對于某些特定人群和特征的數據,獲取難度依然很高,所以這些公司的數據獲取既要大投入拼資本,更要拼行業關系,通過行業上下游的商務合作,進行數據的交換,方能有可能補全自己的數據類型。
數據標注能力其實是ai公司的供應鏈管理能力
所以很多人工智能公司被數據獲取這道門檻擋在了外面,而即使有了數據,并不等于萬事大吉,最重要的是數據標注。只有對數據進行結構化處理,按照算法要求進行精準標注,才能使得模型得以被訓練,識別度、準確率才能穩步提升,進而才能實現產品的迭代優化,從能用到好用的飛躍。而如何在魚龍混雜的數據標注公司里選擇穩健、優質的合作伙伴,成為了各家ai公司采購部門的難題。
在走訪多家數據標注公司并請教行業的專家后,我們不難發現,數據標注公司可以大致分為兩大類:1.0階段,轉包式平臺公司;2.0階段自營式服務公司。
兩者的區別關鍵在于,數據標注公司是否有完全自建的標注團隊,很多自詡為數據標注平臺的公司,普遍采用轉包模式,通過層層轉包,各接包方并不擁有自建的標注團隊,只是賺取微薄的差價。 這類數據標注公司其實并不具備相應的能力,徒有其名而已。
人工智能公司如果選擇這類公司合作,會存在諸多風險,比如對業務需求理解不準確、響應速度慢、調整速度慢、最關鍵的是數據安全根本得不到保障,對于保密級別高的數據類型,選擇轉包類公司合作,無異于飛蛾撲火。
數據安全更加考驗ai公司的風險意識
以91aiwork為代表的2.0階段的自營式數據服務公司,杜絕了行業內層層轉包的弊病,通過完全自建高標準的數據交付中心,達到“物理安全、人員安全、數據安全”,確保客戶數據不被存貯、不被翻錄、翻拍、轉發,360度安全無死角;并依托91aiwork數據服務平臺給予各合作方進行賦能,通過業務培訓、管理培訓、工具支持等全方位的緊密合作。
數據服務的前提是數據安全,如果數據安全得不到保障,給予數據的服務又從何談起,所以數據安全的重視程度,其實倒逼人工智能公司在選擇數據標注合作伙伴時候,不只是關注價格高低,而要先考察對方的業務模式,數據安全的可靠性。在這些基礎上,才能進行商務洽談。
來源:網絡
以上是網絡信息轉載,信息真實性自行斟酌。