ai 是短視頻平臺(tái)的核心能力,快手其實(shí)是一家人工智能公司
2018-09-23 07:00來(lái)源://
原標(biāo)題:ai 是短視頻平臺(tái)的核心能力,快手其實(shí)是一家人工智能公司
ai 如何賦能短視頻平臺(tái)?
這是快手科技 ai 技術(shù)副總裁鄭文在極客公園「創(chuàng)新之火」活動(dòng)上的演講主題。從純粹用于制作、分享 gif 圖的工具性應(yīng)用,到如今成為日活躍用戶量過(guò)億,用戶日均使用時(shí)長(zhǎng)超一小時(shí)的新型短視頻社區(qū),這是快手七年走過(guò)的創(chuàng)業(yè)路。
七年,快手用戶累計(jì)發(fā)布短視頻超過(guò) 70 億條,從搞笑、幽默,游戲、娛樂(lè),到各地風(fēng)土、民情,內(nèi)容各異。對(duì)于快手,不少人認(rèn)為它只是一家短視頻公司,短視頻平臺(tái)跟 ai 技術(shù)的關(guān)系并不大。
但是,如何將每位用戶的注意力高效分配給海量豐富的短視頻,而非集中在少數(shù)爆款之上,光靠人工運(yùn)營(yíng)的方法是不可行的,這必須通過(guò)人工智能技術(shù)來(lái)實(shí)現(xiàn)。
ai 技術(shù)讓記錄生活更有趣
面對(duì)每日數(shù)以千萬(wàn)的新增視頻,該如何將其精準(zhǔn)匹配到用戶眼前?快手 ceo 宿華曾形容,這是快手員工需要面對(duì)的前所未有的難題。為此,快手提出了一整套基于 ai 技術(shù)的解決方案,貫穿視頻生產(chǎn)、內(nèi)容理解,用戶理解,系統(tǒng)分發(fā)等使用快手的每個(gè)環(huán)節(jié)。在極客雇主交流會(huì)現(xiàn)場(chǎng),快手科技 ai 技術(shù)副總裁鄭文說(shuō),ai 是快手連接內(nèi)容生產(chǎn)與消費(fèi)兩個(gè)端口的核心能力。
快手上線了一批爆款特效,像是叫做快手時(shí)光機(jī)的「變老」表情,可以在十幾秒鐘中,讓視頻中人物的容顏?zhàn)兂?60 年之后、還有可以實(shí)時(shí)進(jìn)行肢體識(shí)別的舞蹈游戲、ar 換臉等等。這些玩法背后是快手對(duì)前沿 ai 技術(shù)的開(kāi)發(fā),涉及人體姿態(tài)估計(jì)、手勢(shì)識(shí)別、背景分割等多個(gè)技術(shù)模塊。這是在內(nèi)容生產(chǎn)領(lǐng)域,快手努力將記錄形式變得更加有趣的新嘗試。
用戶通過(guò)快手 app 拍攝、上傳了一段短視頻后,后臺(tái)機(jī)器會(huì)提取其內(nèi)含的基本信息,諸如視頻中人臉的性別、表情、顏值等,嘗試?yán)斫庖曨l內(nèi)容。機(jī)器還會(huì)依照?qǐng)鼍白R(shí)別、物體跟蹤、圖像質(zhì)量評(píng)估等維度,對(duì)圖像進(jìn)行分類。語(yǔ)音識(shí)別,也是機(jī)器理解視頻的重要方面。機(jī)器會(huì)把語(yǔ)音轉(zhuǎn)化成文字,通過(guò)文字理解視頻表達(dá)的含義。快手多媒體內(nèi)容理解(multi-media understanding)部門利用 ai 技術(shù)通過(guò)感知和推理兩個(gè)階段來(lái)解讀一個(gè)視頻,首先感知獲取視頻的客觀內(nèi)容信息,進(jìn)而推理獲取視頻的高層語(yǔ)義信息。
像人把學(xué)到的知識(shí)存到大腦一樣,我們把快手的內(nèi)容整理并存儲(chǔ)到快手知識(shí)圖譜中,這樣融合感知內(nèi)容和知識(shí)圖譜,就可以完成對(duì)視頻高層語(yǔ)義及情感的識(shí)別。
促使機(jī)器理解用戶本身同樣不可或缺。用戶年齡、性別、是否使用 wifi 等注冊(cè)的基本信息,用戶在使用快手時(shí)產(chǎn)生的大量行為數(shù)據(jù),都將傳輸?shù)揭粋€(gè)深度學(xué)習(xí)的模型中用于機(jī)器訓(xùn)練,從而得到一組綜合性的用戶信息,以預(yù)測(cè)用戶的喜好,個(gè)體用戶之間的關(guān)聯(lián)。
快手如何破除「信息繭房」?
讓記錄形式更有趣,讓機(jī)器理解視頻內(nèi)容、深度洞悉用戶,這是快手利用 ai 技術(shù)賦能短視頻平臺(tái)的試探。
快手科技 ai 技術(shù)副總裁鄭文說(shuō),作為前沿技術(shù),人工智能在研發(fā)、執(zhí)行過(guò)程中還沒(méi)有一個(gè)非常成行的流程。根據(jù)自身發(fā)展情況,快手以問(wèn)題為導(dǎo)向開(kāi)展 ai 項(xiàng)目,首先明確需求,接著針對(duì)需求進(jìn)行預(yù)研、收集數(shù)據(jù)、訓(xùn)練模型,之后才是相應(yīng)的功能開(kāi)發(fā)與產(chǎn)品化。
人工智能與算法推薦曾引發(fā)一些爭(zhēng)議,大眾普遍認(rèn)為,智能算法根據(jù)用戶興趣推薦內(nèi)容,久而久之,用戶便會(huì)被自己關(guān)心的事物圍繞,失去對(duì)外部世界的整體認(rèn)知,形成「信息繭房」。對(duì)此,鄭文舉例快手的推薦機(jī)制作答:快手的推薦給用戶的內(nèi)容,絕非僅僅用戶最感興趣的部分,而是會(huì)考慮到內(nèi)容的多樣性,在更廣闊的領(lǐng)域發(fā)現(xiàn)感興趣的內(nèi)容。
鄭文舉例說(shuō),比如在社區(qū)中,會(huì)有一些跟你比較相似但不完全一樣的用戶,那么他們喜歡的內(nèi)容,你也有可能會(huì)感興趣,這樣就不是用戶自己一個(gè)人去探索,而是成千上萬(wàn)相似但不同的人在一起探索。基于這個(gè)邏輯的分發(fā)系統(tǒng),也可以真正顧及到長(zhǎng)尾視頻,讓更多的人被看見(jiàn)。
作為記錄載體,短視頻形態(tài)本身具備普惠性。它極大降低了信息交流門檻,通過(guò)技術(shù)賦能,讓人們可以公平、有趣地記錄與分享生活。在極客雇主的交流會(huì)現(xiàn)場(chǎng),鄭文說(shuō),記錄生活能夠提高人們的幸福感,在快手,人們可以看到更豐富的世界,而他們自己也能夠被世界看見(jiàn)。
來(lái)源:搜狐
以上是網(wǎng)絡(luò)信息轉(zhuǎn)載,信息真實(shí)性自行斟酌。