來源:企業(yè)網
如果你已經決定在今年做更多的人工智能實驗,請首先仔細研究您的數(shù)據(jù)管理實踐。
就在新年前夕,我與一位cio客戶兼朋友進行了交談,他很興奮地談論了如何在2019年“啟動”涉及人工智能的項目。和許多首席信息官一樣,她也渴望趕在出現(xiàn)人工智能可能帶來的破壞之前,充分利用人工智能帶來的好處。在我們的談話中,她讓我?guī)椭私庠撊绾螠蕚洌拍茏屗慕M織在未來幾年能夠“做好ai”。
我的回復?在花任何一美元購買人工智能之前,首先確保你的數(shù)據(jù)是有序的!如果你想讓你的人工智能計劃成功,你必須讓數(shù)據(jù)管理成為你新年的首要任務。
對于一個有一整個團隊和組織正在急切地想要“進入人工智能領域”的cio來說,這可能很難聽到。人們很容易的就一頭扎進數(shù)據(jù)科學和人工智能領域當中。然而,如果不首先了解數(shù)據(jù)管理(以及數(shù)據(jù)的其他方面)的重要性,就很難取得進展。
記住,ai即數(shù)據(jù)。在沒有數(shù)據(jù)的情況下,你無法使用ai或機器學習做任何事情,因此你必須首先確保理解并管理數(shù)據(jù)的生命周期。
好的數(shù)據(jù)管理的標志
數(shù)據(jù)管理雖然不是cio最重要的方面之一,但它對機器學習和人工智能卻是至關重要。老話說得好,“輸出質量是由輸入質量決定的”用在這里非常合適,因為如果你擁有的是糟糕的數(shù)據(jù),你也將得到一個糟糕的模型。一個糟糕的模型反過來又會告訴你去做錯誤的事情,這確實會對你的組織造成一些損害。
也就是說,當你的數(shù)據(jù)管理得當時,人工智能絕對可以改變一個組織的能力和可能性。
為了確保你的組織在使用ai時走上正確的道路,你需要仔細查看你的數(shù)據(jù)管理實踐。一個數(shù)據(jù)管理的關鍵要素之一是理解:
你的數(shù)據(jù)來自何處
誰訪問或更改了該數(shù)據(jù)
如何使用你的數(shù)據(jù)(例如,你是否有權將數(shù)據(jù)用于其他目的?)
收集數(shù)據(jù)的時間
你的數(shù)據(jù)在過去有什么用途(以及將來可能如何使用)。
4個需要檢查的領域
在接下來的一年里,想想你的目標。如果ai出現(xiàn)在這個列表上的任何地方,你都需要認真考慮如何從事一些專注于數(shù)據(jù)和數(shù)據(jù)管理的最佳實踐。在新年的會議中考慮一下這些問題。
首先,為了確保你的數(shù)據(jù)不是垃圾,你需要從全局開始,雖然這聽起來可能違反直覺。你需要構建一個數(shù)據(jù)策略來回答圍繞數(shù)據(jù)的這些“大”問題,然后考慮治理、質量和集成等相關的關鍵元素。以下是我認為可以幫助你為ai做好準備的幾個方面:
數(shù)據(jù)策略:即數(shù)據(jù)的“who, what, when, why, 以及 how”。你的數(shù)據(jù)策略會告訴你所做的一切。如果你沒有數(shù)據(jù)策略,你確實需要制定一個。
數(shù)據(jù)治理:管理組織數(shù)據(jù)的(或應該)的規(guī)則和系統(tǒng)。數(shù)據(jù)治理應該由數(shù)據(jù)策略來驅動。治理應該考慮(并管理)數(shù)據(jù)的所有方面,包括數(shù)據(jù)質量、數(shù)據(jù)訪問和數(shù)據(jù)集成。
數(shù)據(jù)質量:擁有一個能夠確保數(shù)據(jù)準確和有用的過程和系統(tǒng)。數(shù)據(jù)質量的保證需要從收集數(shù)據(jù)的瞬間開始,并在整個數(shù)據(jù)生命周期中持續(xù)。數(shù)據(jù)質量應該由數(shù)據(jù)治理規(guī)則/系統(tǒng)來決定和驅動。
數(shù)據(jù)集成:許多人會將數(shù)據(jù)集成到其他領域(不管他們是否有這樣的意識),但是他們應該在考慮數(shù)據(jù)時就考慮到這一點。它將被數(shù)據(jù)策略所告知和驅動,并與數(shù)據(jù)質量密切相關。必須花時間考慮如何在整個組織和整個數(shù)據(jù)生命周期中集成數(shù)據(jù)。
數(shù)據(jù)管理、數(shù)據(jù)策略和數(shù)據(jù)治理可能不像談論人工智能和機器學習來得那么吸引人,但是在能夠正確地使用人工智能之前,必須先將這些數(shù)據(jù)整理好。當你的同事在下一次社交活動中不斷談論人工智能時,你必須提醒他們數(shù)據(jù)有多重要。提醒他們“輸出質量是由輸入質量決定的”--尤其是在人工智能和機器學習方面。
來源:網絡
以上是網絡信息轉載,信息真實性自行斟酌。