盡管此前蘋果官網(wǎng)上曾表示,Siri 將在2012年支持中文,但在其最新推出的New iPad中,并未出現(xiàn)Siri的身影,不過,這并未影響參考蘋果公司進(jìn)行互聯(lián)網(wǎng)布局的中國互聯(lián)網(wǎng)巨頭有所行動(dòng)——大舉布局中文版Siri,與其相伴的挖角行動(dòng)也隨之展開。
小i機(jī)器人創(chuàng)始人袁輝向本報(bào)表示,目前搶著做中文版Siri研究的公司主要有三類,第一類公司是以安徽科大訊飛信息科技股份有限公司(下稱“訊飛”)為 首的語音公司;第二類公司,以iPhone客戶端開發(fā)、安卓客戶端開發(fā)的團(tuán)隊(duì);第三類是曾經(jīng)做過機(jī)器人、語義分析的一類公司,如小i機(jī)器人。
“據(jù)我了解到的情況來看,目前各大互聯(lián)網(wǎng)巨頭也都在布局中文版‘Siri’,在語音語義兩個(gè)方面都在進(jìn)行各自的研究,預(yù)計(jì)半年左右的時(shí)間,都將會(huì)有新產(chǎn)品面世。”一名從事該領(lǐng)域研究的互聯(lián)網(wǎng)公司人士向本報(bào)表示。
挖角
據(jù)一位曾就職訊飛的員工透露,從2011年底到2012年初,合肥世紀(jì)訊微科技有限公司(下稱“訊微”)陸續(xù)從訊飛挖走了幾十人。不過,訊微及騰訊公司均未對(duì)此事作出回應(yīng)。據(jù)了解,2011年1月訊微是由騰訊斥資2億元投資所成立的子公司。
已在該領(lǐng)域經(jīng)營十載的訊飛,自然知道人才的重要性,從2011年底到2012年初,訊飛提高了相關(guān)工作人員的工資,漲幅超過一倍。一個(gè)有意思的細(xì)節(jié)是, “合肥訊微的第一次招工,時(shí)間定在一個(gè)周六,這天科大訊飛本來是放假,但是管理層選擇了全體加班,以應(yīng)對(duì)訊微的挖角。”上述人士稱。“這些被挖角的人,此 前在訊飛做語音產(chǎn)品的測(cè)試工作,來訊微后主要做手機(jī)游戲的測(cè)試,這次的挖角行動(dòng),并沒有帶走訊飛的核心技術(shù)人員。”一位不愿具名的訊微員工稱。就目前訊微 在其官方網(wǎng)站上發(fā)布的產(chǎn)品頁面數(shù)據(jù)來看,目前訊微主要是在游戲領(lǐng)域發(fā)力。
布局中文版Siri
“以前我們說語音技術(shù)還要解釋半天,Siri無形中教育和引導(dǎo)了這個(gè)市場,訊飛是其中之一的受益者。”訊飛副總裁徐景明說,由于中文版Siri概念的炒 作,半年來其股價(jià)已經(jīng)由去年10月的29元,上漲近30%至38元。在個(gè)人用戶領(lǐng)域,訊飛目前推出了頗受用戶歡迎的訊飛口訊、訊飛語點(diǎn)、訊飛語音輸入法等 產(chǎn)品。由此受益的還有專注于人工智能的小i機(jī)器人。其創(chuàng)始人袁輝在該領(lǐng)域浮浮沉沉10年,致力于將小i機(jī)器人打造成中文版Siri。
與上述兩家公司相比,互聯(lián)網(wǎng)巨頭們則低調(diào)很多。2009年12月,谷歌公司正式推出中文版語音搜索。此后2011年年中,百度推出帶有語音搜索功能的手機(jī)客戶端“掌上百度”。“百度確實(shí)是在這方面有布局,但是目前,我們不方便透露太多。”百度公關(guān)部發(fā)言人李國訓(xùn)表示。
騰訊一名內(nèi)部人士向本報(bào)表示,騰訊在語音方面的產(chǎn)品目前主要布局在搜索領(lǐng)域。“在語音交互方面,騰訊的手機(jī)瀏覽器、音樂、地圖等都已支持語音搜索功能,語義方面也有研究,后續(xù)會(huì)有新的產(chǎn)品面市,這塊主要是騰訊搜搜團(tuán)隊(duì)在運(yùn)作。”
徐景明表示,訊飛和騰訊在無線領(lǐng)域正在進(jìn)行語音合作,比如移動(dòng)QQ、移動(dòng)搜索等領(lǐng)域,訊飛2011年的財(cái)報(bào)收入中,有1000萬來自與騰訊合作的業(yè)務(wù)。 騰訊研究院院長鄭全戰(zhàn)向本報(bào)表示,騰訊一直關(guān)注語音語義技術(shù)的發(fā)展,并于一年前在騰訊研究院組建了一個(gè)以語音語義為重點(diǎn)研發(fā)方向的團(tuán)隊(duì),“目前研究院推出 了一款語音輸入法的產(chǎn)品,與搜搜團(tuán)隊(duì)的產(chǎn)品有時(shí)候會(huì)有重合的部分。”“Siri創(chuàng)始人對(duì)Siri新的定義是,20%的語音識(shí)別,即Siri能將語音轉(zhuǎn)化成 文字;加上80%的網(wǎng)絡(luò)機(jī)器人,即能理解你的意思(語義),并做出反應(yīng)。”袁輝解釋道,“訊飛一直在做的事情是20%的內(nèi)容,即語音識(shí)別;小i機(jī)器人一直 在做的是80%的內(nèi)容,而目前的難點(diǎn)還是在80%上面。”
據(jù)一位業(yè)內(nèi)公司高管透露,騰訊實(shí)際上是在做整個(gè)自己的Siri,語音只是一個(gè)部分,語義也在研究。“騰訊一定會(huì)將Siri作為一個(gè)重點(diǎn)關(guān)注的方向,但是目前人不多,就是研究院的人在做,差不多幾十個(gè)人。”
“語義”難
“蘋果目前推出的Siri產(chǎn)品,是一款人工智能產(chǎn)品加上Nuance語音識(shí)別功能的融合。所以訊飛真正要定位只能定位中國的Nuance,而不是中國的 Siri。”袁輝表示,小i機(jī)器人正在尋求與Nuance等語音公司進(jìn)行合作。徐景明向本報(bào)表示,語義方面是要一個(gè)長期積累的過程,訊飛目前也還在持續(xù)投 入。
但語義方面,正是目前的難點(diǎn)。語義需要機(jī)器人對(duì)輸入的語境進(jìn)行判斷。舉個(gè)簡單的例子,當(dāng)用戶詢問機(jī)器人:“今天北京的天氣怎樣?”它回答:“晴朗。”用戶再詢問,“上海呢?”機(jī)器人能結(jié)合上下文的語境,判斷用戶問的問題是上海的天氣,并作出回答。
“人工智能一定是人工加智能,需要通過海量信息的搜集,以及整個(gè)網(wǎng)絡(luò)知識(shí)結(jié)構(gòu)的沉淀,需要不斷地對(duì)機(jī)器人進(jìn)行訓(xùn)練。在這個(gè)過程中,人工一定要參與,這也是為什么蘋果在印度招工程師整理知識(shí)庫的原因。”袁輝表示。
人工智能,第一步要通過算法模擬人類思維理解人類在講什么,需要不斷地檢驗(yàn)這個(gè)算法是好還是壞;第二步,得有一個(gè)成長的知識(shí)庫系統(tǒng),讓字節(jié)經(jīng)過整理變成 數(shù)據(jù),數(shù)據(jù)經(jīng)過整理能變成信息。而這些正是做語音交互要攻克的難點(diǎn),目前Siri功能的不完善,亦讓蘋果公司飽受非議。
據(jù)《華爾街日?qǐng)?bào)》報(bào)道,今年3月份,蘋果公司就陷入了與一名iPhone 4S用戶的法律糾紛之中,原因是一名叫做Frank Fazio的用戶認(rèn)為,蘋果在為其虛擬 個(gè)人助理Siri所打的廣告當(dāng)中包含“誤導(dǎo)和欺騙”的性質(zhì)。亦即Siri廣告當(dāng)中向人們所展示的簡便使用性,并不能在現(xiàn)實(shí)生活當(dāng)中實(shí)現(xiàn)。“蘋果在最新的 New iPad 中,都沒有推出Siri功能,就是因?yàn)樗麄円獙?duì)Siri的語義部分進(jìn)一步完善,但是這些都需要長時(shí)間的積累,不是一年兩年就能做成 的。”袁輝表示。“目前騰訊、百度都是投入比較小型的團(tuán)隊(duì)去做這件事情。主要是因?yàn)樘O果在做了,這必定是一個(gè)方向,但是還沒有將其放到整個(gè)公司戰(zhàn)略層面上 來,他們的投入說白了是不夠的。”一名與多家互聯(lián)網(wǎng)企業(yè)語音交互部門有過密切接觸的人士向本報(bào)表示,蘋果投入如此巨大,因?yàn)樘O果有非常清晰的短期戰(zhàn)略,但 是中國企業(yè)現(xiàn)在去做更多的是跟風(fēng),且基本上對(duì)整個(gè)語音交互市場,目前都沒有明確的戰(zhàn)略規(guī)劃。