真正偉大的創新,將會決定很長一段時間人類改變世界的方式,比如蒸汽機或計算機,而Kinect在這一視角下,幾乎必然會成為一種關鍵力量。
微軟公司首席研究官里克·雷斯特安靜地坐在記者面前,溫文爾雅,與他實際的身份相比,看起來更像是一個在大學呆了許久的教授。開始采訪后,沒想到我們第一個話題并不是關于微軟,也不是關于計算機或互聯網,而是蒸汽機。
整個社會每隔幾十年或上百年,就會出現一次比較大的創新,可是這樣的創新會給世界帶來多大的影響呢?“你要了解這一點,最好的方法是去倫敦的大英科學博物館參觀,去看看里面那些個頭巨大的蒸汽機展品。”里克說。
16世紀到17世紀,蒸汽機的出現和不斷改良對英國社會和全世界產生了巨大的影響。曾幾何時,蒸汽機是一切問題的答案——無論你想建造任何事物,或者開展任何工程,都可以通過設計,讓蒸汽機來完成。
這是真正偉大創新的力量,它決定了之后很長一段時間人類改變世界的方法。而我們現在正在經歷的或許與之相仿,只不過不是由蒸汽機、而是計算機所驅動的創新時代。如果說蒸汽機決定了人們改造和創造世界的方法,則計算機更多地為人類觀察和了解世界提供了一種方法論,從廣袤的宇宙到微小的細胞,乃至人與人的組織形態。
如果說人的進化在于對工具使用的不斷升級,則我們正在面臨一個工具再次革新的時代。在這樣的背景下,Kinect正在通過對人機交互的改變,提供一種關鍵力量。
Kinect超現實世界
恰逢微軟研究院20周年,記者有機會在西雅圖參加了“微軟技術節”(TechFest)的公開部分。雖然不能獲知各種技術將如何與產品結合的進一步細節,但所看到的技術已經讓人大為驚訝。走進展廳,密密麻麻的技術展示讓人仿佛置身于科幻世界,其中大部分技術已經有了相當強的應用場景展示——如果它們真能應用到現實社會中,無疑將刮起一陣科技風暴。
Chris Harrison站在那里,他左邊肩膀上放著一個奇怪的裝置,那是一個微型Kinect和投影儀的組合。這個來自微軟雷德蒙研究院的小伙子笑了笑,向前伸出了自己的左手,只見一片光打下,手中出現了一個Windows Phone的投影。
可這不只是投影而已,他用右手開始點擊投影出的手機,一切開始運轉,這個虛擬手機用起來和真實的手機一模一樣。他嘗試打了個電話,又打開相簿,偏了偏肩膀,圖片開始在墻上更大的區域展示。
這玩意兒有個一看就懂的名字,“可穿著的多點觸控交互”,是他正在研究的技術,能在生活中常見的表面上實現交互式多點觸控應用。它不需要任何校準就可以提供類似鼠標或觸摸屏的功能,不止如此,還能輕易識別手指在懸空狀態下的指令,與2D的觸摸屏相比,變成了一個“觸摸空間”。
看似簡單的搭配:Kinect識別動作、投影儀展示、用云計算處理信息,卻產生了遠遠超過現有觸摸交互的效果。通過距離判定,它還能進行身份判定,只識別使用者手指所進行的操作。想想看,與現在帶個手機或平板相比,未來每個人可能只需要攜帶一個巴掌大小的裝備就夠了。
比這個更有趣的是Harrison的同事Hrvoje Benko所展示的Beamatron技術。他手拿一個像玩具汽車操縱桿的玩意兒,在地上控制一輛投影出來的虛擬汽車。汽車在現實中的房間地板上行駛,碰到斜坡或墻壁,還能自己上下坡和遇到碰撞時產生反應,和一輛真正的玩具車差不了多少。
它的實現原理和之前類似,可應用的場景嚴格來說歸于“增強現實”類,實現了相當有趣的虛擬圖層和現實的交互,并能根據指令產生不同的反饋。讓虛擬的人或物在一片現實的障礙中穿行,這提供了很大的想象空間,不只是在未來的娛樂領域。比如,根據人在客廳里的行動,自動把他所收到的新郵件或者新短信放到他的視野范圍內,這樣就不會錯過任何一個信息了。
幾乎每一個技術都能引發無盡的想象。在一個角落的展臺上,記者看到了一副真實的“機器人之眼”。它由兩個Kinect所組成,模仿人的眼睛向外觀察事物,并且遠程連接到用戶面前。你的面前會展現出機器眼睛所看到的場景,它是3D的,并且會隨著你頭的轉動來調換場景。這可真是“足不出戶知天下”了。
而在它不遠處,有個名為IllumiShare的分享技術,很多人圍繞在它周圍。這是個看起來像臺燈的裝置,它提供了一個共享的方形平臺,利用Kinect的捕捉能力,能讓身處不同空間的兩個人在同一個平臺上畫畫或展示物品,效果相當驚人。據技術研究者、來自微軟印度研究院的Sasa Junuzovic介紹,要實現這樣的效果成本并不高,商用起來很方便。
這一切讓人眼花繚亂。事實上現場還有很多很酷的技術,幾乎所有最熱的名詞如增強現實、裸眼3D、動態捕捉、近場交互、實時翻譯,都能在這里找到正在不斷研究且進展很快的技術真身,比如當你口述一段中文,機器自動將它變成和你口音一模一樣的意大利語;又或者你能用手指非常簡單地取代鼠標,精確在空中完成對電腦的操作。
但其中最耀眼的明星仍是Kinect。這個已經在微軟Xbox游戲機中得以商用的、價格低廉的裝置正在引爆更大的想象空間,并激發了微軟全球各個研究院中技術開發者們去以它為基礎實現更深層、更具體的技術創新。記者詢問了許多新技術的開始時間,它們很大一部分都是開始于近兩三年內,那正是Kinect在游戲玩家中最初流行的時候。
其實,Kinect本身的實現原理并沒有那么復雜,但它成功地用一種更自然的方式實現了對現實世界中尤其是人的動作捕捉。其意義在于,它讓計算機有了更準確有效的“眼睛”去觀察這個世界,并根據人的動作來完成各種指令。
方腦袋的機器人
“我覺得我們已經進入了這樣一個時代:計算機漸漸擁有了能夠與人類相媲美的能力——它們能看到、聽到、觸摸、感覺、了解我們所處的地點和感知運動狀態。我們逐漸賦予了計算機這些能力,并用它開辟出巨大的用武之地。”里克說,“我們已經取得了不錯的進展,比如Kinect這種相對廉價的裝置,能看到你的運動并識別動作,并利用這些信息來控制用戶界面。”
有意思的是,即便在技術研究界,大家也對Kinect如此管用感到很意外和驚訝,它開創了一個全新的研究領域,所有人都會想:“我們可以用Kinect來干點別的什么呢?”
而微軟做的事情是順水推舟。在不久之前,微軟發布了Kinect的Windows SDK套件,允許全世界對此有興趣的人基于Windows操作系統來挖掘Kinect的可能性,目前其下載量已經十分巨大。還記得Kinect剛發布時的標語,“身體就是控制器”,很多初創企業在這種新的人機交互方式中發現了蘊藏的機會。
微軟研究院自己自然首當其沖。里克舉了一個例子,當醫生在做手術時,他很多時候需要查詢關于病人的信息,比如在動作空間很小的血管手術里查看關鍵脈絡,可他們因為衛生原因,又無法在手術狀態下用任何觸摸來完成信息的檢索。而現在利用Kinect,醫生完全可以實現這一點。
在人眼無法看到東西的暗處,Kinect也有妙用。它能通過紅外攝像頭“看到”事物,并且根據人的動作,經由不同聲音的播放來對人進行提醒。這種方式對盲人格外有效。
在卡內基梅隆大學,人們正在用Kinect攝像頭來控制機器人,讓機器人自己獨立走遍新落成的計算機系大樓。機器人能看到來往的人并及時避讓,還會道歉。機器人會使用電梯——機器人不一定會操控電梯,但是它可以等候其他人到來,并請求別人幫助它進行相應的操作。據說這臺機器人行動很快,不像傳統大家看到的機器人那么緩緩挪動。
里克最近還看到一項演示,一家公司正在研究如何將Kinect攝像頭用在超市購物車上,這樣購物車就可以自動地跟隨人們逛店購物。把商品放進購物車時,它會自動通過攝像頭掃描,知道你所購買的是什么,并且在整個購物過程中提供協助。
Kinect與計算機的未來
正如無數科幻影片里所看到的,“機器人時代”正在到來,只不過它并非以擬人的方式存在,而是以計算機的形態出現在人們周圍。它們通過攝像頭來“看”,通過麥克風來“聽”,一連串的語音分析技術和算法正在讓它聽得更智能;還有觸摸和了解,微軟等公司的大數據計算分析技術正在為“機器人”構建越來越智慧和豐富的“大腦”。
而Kinect正是讓“機器人”的眼睛升級的過程,由此激發的各種應用場景下的創新,則是由眼睛連接到“大腦”并給予反饋的方式。
“這雙眼睛”本身也在不斷完善。微軟亞洲研究院的趙春水和顧嘉唯為記者演示了“支持手勢識別的下一代網絡攝像頭”,這簡直就是一個活生生的最適合PC電腦場景下的寶貝。
與Kinect相比,它距離更近、實現更精確、視野更廣,能夠捕捉“雙目”立體視頻和高精度圖像,比如人臉的細節甚至是指紋。這意味著什么?我們可以用比《少數派報告》中湯姆·克魯斯更酷的方式來操控我們的信息,我們可以用更個性化的指紋或面部識別方式來管理我們的身份,甚至還有與過去“鼠標+鍵盤”時代完全不同的使用軟件和互聯網的方式。
未來,你很有可能只需要做一個打響指的動作就開啟QQ,或者翹起大拇指來刷新微博。與很多行業應用相比,這股Kinect引發的創新潮流將會在未來10年對大眾與社會產生深刻的影響。
“回頭看70年前,有些體力勞動是非常艱難的。我看過一篇20世紀20年代的文章,當時的人們盼望著結束每天工作16小時的生活。人們的工作時間很長、強度很大,壽命卻很短。”里克說,“現在人們有越來越多閑暇時間,能夠以更高效率完成工作,并且還有更多自我實現的機會。我想如果沒有計算機,很多事情不會如此變好。”
通過Kinect,我們看到了在人類改變世界中更大的可能性,與此同時,計算機逐漸可以被人以一種更加簡單的方式去使用與控制。未來可能再也不用學輸入法、編程甚至是外語,我們天生就可以和任何計算機、任何人對話,以我們最自然的方式。