對現(xiàn)在的手機用戶來說,使用手機攝像頭拍照識圖并不是一個陌生的功能,花草、商品等物品,使用很多App都可以做到相對精準(zhǔn)的識別。不過,我們在使用中也不難發(fā)現(xiàn),不管畫面里有多少種物品,這些App基本只能做到識別其中的一種,并不能像人眼觀察世界一樣,對所見的目標(biāo)同時進(jìn)行識別。在今天舉辦的“Baidu Create 2019”百度AI開發(fā)者大會上,百度高級副總裁、移動生態(tài)事業(yè)群組總經(jīng)理沈抖展示了百度App上的“動態(tài)多目標(biāo)識別”技術(shù),就讓我們的手機朝著“像人眼一樣觀察世界”又走近了一步。

(百度高級副總裁、移動生態(tài)事業(yè)群組總經(jīng)理沈抖做主題演講)
“動態(tài)多目標(biāo)識別”技術(shù)是一項基于移動端實時感知和云端視覺搜索的類眼視覺AI技術(shù),能夠?qū)崿F(xiàn)所見即所得的信息瀏覽體驗,推出于2018年底,并且目前已經(jīng)在百度App上應(yīng)用。據(jù)沈抖在百度AI開發(fā)者大會現(xiàn)場介紹,“動態(tài)多目標(biāo)識別”技術(shù)是基于飛槳移動端部署庫所實現(xiàn),為了讓這項技術(shù)可以在手機端流暢運行,把云端原本200兆字節(jié)的視覺算法模型優(yōu)化到了小于5兆字節(jié),并實現(xiàn)了100毫秒以內(nèi)識別物體、8毫秒內(nèi)判斷物體位置并追蹤更新這樣的技術(shù)指標(biāo)。
將這一技術(shù)應(yīng)用在百度App上之后,用戶在使用中所能感受到的最大的不同就是同畫面中可以被識別的物品不再只有一個,并且隨著用戶實時移動攝像頭,百度App也會在實時追蹤已識別的物品的同時,識別新進(jìn)入畫面中的物品。
用戶想要體驗“動態(tài)多目標(biāo)識別”非常簡單,只要打開最新版百度App,點擊搜索框右側(cè)的相機按鈕,然后在拍照界面選擇“通用”場景下的“自動拍”模式即可。在AI開發(fā)者大會現(xiàn)場,沈抖使用該技術(shù)對多款不同品牌的化妝品進(jìn)行了識別演示,識別效果迅速且準(zhǔn)確。在精準(zhǔn)識別的基礎(chǔ)上,借助百度移動生態(tài)提供的信息和服務(wù),用戶還可以進(jìn)行多平臺比價、直接下單購買等操作。
據(jù)介紹,百度App目前可以識別超過1000萬種物品,其中包含了20000多種植物以及上百萬種美妝產(chǎn)品;在此基礎(chǔ)上,百度App還支持超過30種場景的智能判斷,可以針對被識別物品的不同,提供不同的擴展信息和服務(wù),例如識別出商品后提供同款和比價功能,識別出植物后提供辨認(rèn)技巧和養(yǎng)護(hù)知識,識別出菜品或食材后提供熱量知功效等信息,識別出題目后提供答案及解題分析等等。

(現(xiàn)場演示百度App實時動態(tài)多目標(biāo)技術(shù)一次識別兩款化妝品成功)
AI技術(shù)不斷向前發(fā)展的同時,也在不斷地走近我們的生活。憑借著領(lǐng)先的技術(shù)以及針對移動端的優(yōu)化、適配,百度App“動態(tài)多目標(biāo)識別”技術(shù)不但可以讓我們現(xiàn)在手中的手機攝像頭變得更加智能,在未來可能到來的IoT時代,這項技術(shù)還會讓更多的設(shè)備具備智能交互能力,帶給用戶更智能的AI交互體驗。

