在這個人工智能越來越流行的年代,為什么互聯網公司總是那么懂你,電商app總能推薦出你喜歡的商品,當你進入新聞app的時候,總能推薦出你感興趣的新聞,當你想去旅游的時候,旅游app能給你推薦景點以及酒店。其實在你的每次點擊,互聯網公司后臺都進行了成千上萬次運算,才能洞悉你的喜好,推薦給你最心儀的產品,智能推薦,是人工智能的一個分支。今天我們來談一談人工智能是如何洞悉你的喜好,更加懂你,給你推薦的呢?幾乎所有的推薦算法都是包含這些東西,數據采集、數據存儲、模型訓練、推薦算法。
數據采集
無論我們在應用app還是網頁上進行任何一次操作,都會被記錄下來。例如某某用戶在某個時間點聽了某首歌,某個用戶在某個時間點看了某個新聞,這種記錄的行為,我們稱之為數據采集。根據不同的業務類型,不同的數據格式,我們會選擇不同的存儲,可能是數據庫,也有可能是大數據的hive,甚至一些臨時數據可能只放在redis之類的緩存。
數據處理
在上述我們收集了大量的數據后,就開始進行數據清洗,清洗完成后,就開始采用一定的算法與模型進行訓練,對用戶進行分類,打上標簽。什么是標簽呢?例如90后,愛看球,程序員這些都是標簽,我們稱之為用戶畫像。每個人在每個互聯網公司都有一個用戶畫像,能否準確地描繪出用戶畫像,是衡量每一個互聯網公司人工智能標準的高低之一。
不僅是用戶,每個公司也會對自己的產品,不局限于內容或者實體進行分類,給產品也打上標簽。為什么需要這樣子呢?因為人工智能并不像人類一樣,對每個東西都有著抽象的認識,舉個簡單的例子,人描述一個人臉,就是兩個眼睛1個鼻子1個嘴巴,而讓機器來描述一個人臉,就需要采樣那幾個點,這幾個點有什么特征,距離多少,顏色應該是什么樣等等等。需要把抽象的概念變成形象的數字,才能進行下一步的運算。
推薦計算
在有了上面的模型之后,用戶的每一次點擊,都會過來后臺開始請求。人工智能會根據之前的數據進行成千上萬次運算,怎么計算呢?這里又需要一定的算法。舉一個簡單的例子,用戶想去旅游,人工智能算法就會找到當季哪一些比較適合出游的經典進行推薦。比如說你想吃東西,人工智能發現你是這個地區的人,就給你推薦本地人愛吃的,否則給你推薦外地人愛吃的。人工智能還能根據你喜歡的歷史進行推薦,也能進行協同過濾,根據你喜歡的找出相似的。
人工智能算法一把會采用多種不同的算法,求出你可能喜歡什么,然后進行排序,把它認為你更有可能喜歡的放在前面,越在前面的越有可能被你看到,當然,你以為這就結束了么?
當你在頁面上停留,或者點擊某個人工智能推薦給你的東西之后,都會把這個數據記錄下來,下次就更能判斷出你的偏好。
來源:網絡
以上是網絡信息轉載,信息真實性自行斟酌。