9 月 20 日-10 月 7 日,谷歌AI體驗(yàn)展在上海龍美術(shù)館(西岸館)展出。谷歌總共展出了 17 個(gè)互動(dòng)項(xiàng)目,和九月底人工智能大會(huì)上谷歌介紹的項(xiàng)目有一些重疊,也有一些區(qū)別。這次體驗(yàn)展沒有背后的技術(shù)原理介紹,是純粹的成果體驗(yàn),所以不需要有專業(yè)知識(shí)即可參觀。
事實(shí)上,場館里隨處可見組團(tuán)而來的中小學(xué)生。展出的項(xiàng)目中,有些比較前沿,讓人可以深刻體會(huì)到谷歌領(lǐng)跑于世界的創(chuàng)新能力和強(qiáng)大的平臺(tái)實(shí)力,但也有一些小項(xiàng)目,僅僅是工程師們利用業(yè)余時(shí)間開發(fā)完成的。這個(gè)現(xiàn)象也非常符合谷歌公司文化(插句題外話,關(guān)于谷歌文化介紹,推薦一本書《重新定義公司-谷歌是如何運(yùn)營的》)。
這些項(xiàng)目都有一個(gè)共同點(diǎn),就是使用了AI技術(shù)。
谷歌在2010年初退出中國搜索領(lǐng)域市場后,2016年在北京首次召開中國開發(fā)者大會(huì),17、18年則在上海召開,大會(huì)的主題也從安卓慢慢向人工智能轉(zhuǎn)變。本次體驗(yàn)展也是與2018開發(fā)者大會(huì)同期進(jìn)行。可以看出,雖然已經(jīng)過去了8年,但是隨著AI浪潮的到來,谷歌對中國的熱情不減反增。
近年來,作為一家 AI First 的公司,Google 在人工智能領(lǐng)域已經(jīng)開發(fā)出了非常多的應(yīng)用,比如 Google Photos、Google Lens、猜畫小歌小程序等。在本次展覽體驗(yàn)上,許多新奇的 AI 應(yīng)用場景都得以展現(xiàn),包括以色搜圖、3D作畫、AI手影識(shí)別、智能化生成皮影戲、AI二重唱等等。
本文就用一些圖片和視頻對這次展覽做下記錄。
入口歡迎PPT
以色搜圖項(xiàng)目
用戶可以在旁邊的面板上任意選擇五個(gè)不同顏色,AI程序會(huì)自動(dòng)搜索主色調(diào)符合這五個(gè)顏色的藝術(shù)品。
這個(gè)算法實(shí)現(xiàn)起來比較簡單,事先提取每件畫作的色調(diào),然后與體驗(yàn)者選取的顏色值進(jìn)行比較匹配即可。實(shí)現(xiàn)難點(diǎn)在于谷歌搜集了600多家博物館館藏畫作。谷歌工程師可以很方便地基于這個(gè)數(shù)據(jù)庫實(shí)現(xiàn)自己的任何idea,這就是強(qiáng)大平臺(tái)實(shí)力所提供的便利之處。
另外提一點(diǎn),展覽內(nèi)的志愿者都是上海各大高校的學(xué)生通過面試選拔出來的。
AI識(shí)別手影生肖
將投影在墻上的手影識(shí)別為生肖動(dòng)物,這個(gè)和下一個(gè)的皮影戲項(xiàng)目比較類似。用到了圖像處理與模式識(shí)別知識(shí)。
AI生成傳統(tǒng)皮影戲
識(shí)別手影為一個(gè)皮影戲的角色,并且將這個(gè)角色添加到皮影戲中,自動(dòng)生成故事情節(jié)、動(dòng)作、聲音。依然是圖像處理算法的應(yīng)用。
VR 3D做畫
體驗(yàn)者可以通過VR眼鏡和一個(gè)手柄,在虛擬世界里繪制一副3D畫作。這個(gè)項(xiàng)目是排隊(duì)最長的一個(gè),因?yàn)轶w驗(yàn)感極強(qiáng)。
隨手涂鴉匹配世界名作
體驗(yàn)者隨意畫一個(gè)簡單的線條圖,AI程序可以搜索到與之最相似的藝術(shù)畫作。這里的畫作數(shù)據(jù)庫和第一個(gè)以色搜圖是同一個(gè),包括之后還有幾個(gè)項(xiàng)目,都會(huì)用到這個(gè)數(shù)據(jù)庫。
按視覺相似性排列的藝術(shù)畫作
AI程序?qū)⒖瓷先ケ容^像的藝術(shù)品放在相鄰的位置,這個(gè)圖海的效果實(shí)在太酷了!
AI二重唱
屏幕上藍(lán)色為人彈奏的聲音,黃色為AI智能程序彈奏的聲音。不得不說現(xiàn)在小學(xué)生會(huì)彈鋼琴的太多了,本人排隊(duì)期間,平均不到十個(gè)人就有一個(gè)可以彈出曲子。一首致愛麗絲送給大家。
對這個(gè)項(xiàng)目背后的技術(shù)不太了解。現(xiàn)場體驗(yàn)來看,AI程序并不是在體驗(yàn)者一開始彈奏時(shí)就插入音符,而是自動(dòng)學(xué)習(xí)幾秒之后才會(huì)開始伴奏。另外背后是基于什么模型標(biāo)準(zhǔn)去添加音符也不太清楚。
如果各位看官有了解的可以在評論區(qū)留言。
VR
VR的發(fā)展從12年Oculus Rift開始眾籌算起,13年推出開發(fā)者版本,至今已經(jīng)商用了五六年,現(xiàn)在也不能算什么新鮮事物了。如果對VR的技術(shù)感興趣可以去維基百科搜索Palmer Luckey與Steve M. Lavalle。他倆是OculusVR的創(chuàng)始人和早期核心員工,一位主攻3D視覺方向,另外一位主要解決傳感器數(shù)據(jù)融合、頭部姿態(tài)預(yù)測跟蹤等問題。
這些都是VR產(chǎn)品需要解決最基本核心的問題。
AR
這個(gè)項(xiàng)目展出的AR就是一個(gè)靜止的2D效果,簡單地在體驗(yàn)者背景里添加一張畫作。從技術(shù)角度看這個(gè)AR的項(xiàng)目的難度遠(yuǎn)低于下邊的谷歌AR翻譯。
AI識(shí)別人體動(dòng)作
程序?qū)崟r(shí)地識(shí)別體驗(yàn)者的四肢姿勢,并且從圖片庫里找到和你擺出同樣造型的照片。事實(shí)上,識(shí)別人體骨架這個(gè)功能很早就實(shí)現(xiàn)了,包括微軟kinect的體感游戲,也已經(jīng)商用了很多年。
谷歌AR翻譯
識(shí)別并且翻譯語言,并且將翻譯的結(jié)果以AR的效果實(shí)時(shí)地貼在相機(jī)預(yù)覽界面中。這個(gè)使用了OCR技術(shù),并且依賴谷歌翻譯。
其強(qiáng)大之處有四點(diǎn):一,可以在一個(gè)界面中跟蹤多個(gè)需要翻譯的對象,互不干擾。二,所有工作可以在手機(jī)端側(cè)完成,脫離谷歌云服務(wù)完全不受影響。只要用戶事先下載好對應(yīng)的語言包,斷網(wǎng)之后依然可以完成翻譯及渲染工作。三. 支持翻譯的語言超過百種。國內(nèi)百度翻譯只支持三十種左右,且不支持AR翻譯。有道翻譯支持AR翻譯,但僅限部分手機(jī)機(jī)型,即使是支持AR翻譯的機(jī)型,語言也只支持三十幾種。這樣一對比大家就能體會(huì)到谷歌實(shí)力的恐怖之處。四,除了AR翻譯,谷歌翻譯還支持語音翻譯,以及在其他安卓應(yīng)用界面直接選中文字翻譯。
大家可以去應(yīng)用市場下載谷歌翻譯進(jìn)行體驗(yàn)。這個(gè)項(xiàng)目的完成也依靠了谷歌長期技術(shù)積累的兩大平臺(tái)能力,翻譯能力與安卓操作系統(tǒng)。
藝術(shù)品之間的關(guān)聯(lián)性
體驗(yàn)者可以隨機(jī)任選兩幅完全沒有關(guān)聯(lián)的畫作,AI程序可以搜索藝術(shù)品數(shù)據(jù)庫,通過幾幅作品將兩幅完全沒有關(guān)系的畫作聯(lián)系起來。
如下圖,體驗(yàn)者隨機(jī)選擇了最左邊的人像A和最右邊的藝術(shù)品B,AI程序可以搜索出一些其他畫作,實(shí)現(xiàn)從A過渡到B的效果。從效果看這個(gè)與神經(jīng)網(wǎng)絡(luò)各層之間實(shí)現(xiàn)的過渡比較相似。
AI創(chuàng)作歌詞與曲調(diào)
通過拍一張照片,AI自動(dòng)識(shí)別里邊的元素,比如“眼鏡”、“棒球帽”,然后將這些關(guān)鍵字串聯(lián)為歌詞,通過RAP配上音樂說唱出來。
EMOJI表情
根據(jù)提示的表情包,在現(xiàn)實(shí)生活中找到對應(yīng)的物體。如手表,手機(jī)AI程序會(huì)自動(dòng)判別你找到的物品是否與表情包對應(yīng),如果對應(yīng)那么就會(huì)提示你成功。
猜畫小歌
根據(jù)提示的詞語,繪制簡筆畫,手機(jī)AI程序會(huì)自動(dòng)判斷你繪制的簡筆畫是否符合要求,比如狗、手表、紅綠燈、鯊魚等。
這是個(gè)微信小程序,大家用手機(jī)就可以體驗(yàn),直接在微信搜索小程序“猜畫小歌”即可。
放大細(xì)觀世界珍寶
這個(gè)就是用三面巨屏展示藝術(shù)畫作,和AI沒什么關(guān)系,給人感覺是為了契合“科技與藝術(shù)”主題而拿來湊數(shù)的項(xiàng)目。
總之,所展出的項(xiàng)目大多是使用了2D圖像處理技術(shù)。包括AR翻譯,其實(shí)也是對每一幀圖像進(jìn)行物體識(shí)別跟蹤。相比而言,語言聲音類與3D圖像類比較少。
后記
09年李開復(fù)先生的離開使谷歌缺少了中國本土化的潤滑劑,直接或者間接導(dǎo)致了當(dāng)年的退出內(nèi)地事件。而今年9月份AI女神李飛飛宣布離職,重復(fù)的故事又在上演,這距她17年加入谷歌都未滿兩年。雖然從這次展覽的項(xiàng)目可以看出谷歌已經(jīng)在小心翼翼地收斂著自己的鋒芒,但是入華進(jìn)程依然道阻且長。
本站文章版權(quán)歸原作者及原出處所有 。內(nèi)容為作者個(gè)人觀點(diǎn), 并不代表本站贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé),本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。本站是一個(gè)個(gè)人學(xué)習(xí)交流的平臺(tái),網(wǎng)站上部分文章為轉(zhuǎn)載,并不用于任何商業(yè)目的,我們已經(jīng)盡可能的對作者和來源進(jìn)行了通告,但是能力有限或疏忽,造成漏登,請及時(shí)聯(lián)系我們,我們將根據(jù)著作權(quán)人的要求,立即更正或者刪除有關(guān)內(nèi)容。本站擁有對此聲明的最終解釋權(quán)。