央視315晚會令Cookie迅速風靡,也引發了公眾對網絡隱私的關注和熱議。“與搜狗等等云輸入法相比(不特指搜狗),Cookie簡直弱爆了。云輸入法能記錄用戶所有的輸入,包括用戶網絡帳號密碼等敏感信息,對應成用戶專屬的詞庫,甚至堂而皇之地統計每個用戶輸入了多少文字。而對廠商來說,在服務器上存儲和挖據文本輸入數據無疑是相當輕松的事兒”,一位供職數據安全和監控審計公司的工程師這樣表示。
一個不爭的事實:詞庫積累就是存儲隱私
前些天搜狗輸入法推出“智慧版2.0”,宣傳擁有一個獨特的“心有靈犀”功能。乍一看這輸入法還能這么聰明呢,無論用戶“聊天”、“搜索”、“寫作”還是“購物”,它都能像諸葛亮一樣的未卜先知用戶想要輸入什么并優先展現。可靜下心來一琢磨這事兒不對啊,為嘛用戶想輸入什么搜狗全知道,搜狗的這些數據又從何而來?
圖1:搜狗輸入法“智慧版”擁有未卜先知的神奇力量?
答案是:“詞庫”。中文輸入法自搜狗開啟“云輸入”先河之后,基本上都有了方便的聯想功能,一個詞語或者一個字符串經常被鍵入,就會被輸入法程序作為高頻詞保留下來,優先出現。
如果僅僅在電腦本地記錄輸入習慣,不僅方便,也不用擔心泄露隱私。問題是,搜狗輸入法還有帳號體系,登錄帳號后,換一臺電腦甚至手機,也能夠直達自己的詞庫。靠的是什么?搜狗服務器記錄了用戶輸入數據,而且有帳號直接對應。
一個大大的驚嘆:輸入法才是真的隱私大戶
或許大家和我的疑問一樣,輸入法公司要這些詞庫干什么?作用大了,因為不僅可以藉此分析用戶群對某一產品的看法需求,甚至還可以有用戶的輸入習慣來研究其偏好,進行精準的網絡廣告推遞。更嚴重的是如果用戶的輸入法能夠導出文本格式的用戶詞庫,只需要看這個詞庫,你最近一段時間的思想、行為一目了然,這是最真實的隱私。
圖2:智慧的輸入法都伴隨著智慧的廣告?
回到搜狗輸入法“智慧版”,還有個很多人都沒關注到的細節——搜索截流。所謂搜索截流,其實就是把用戶輸入的文本提交到搜狗服務器上查詢,再返回可用的搜索結果。最簡單的例子,當用戶輸入qq時,搜狗輸入法直接展現一個QQ下載按鈕。試問,如果搜狗不知道用戶輸入了什么內容,怎么做到返回QQ下載的結果?
用隱私實現功能可以,但請你不要泄露!
看過《黑客帝國》和《云圖》的影迷,一定對未來世界中機器拿人類、人類拿AI人當作能源,反復利用無限循環的惡劣場景記憶猶新。遺憾的是在當下的互聯網,網民的隱私也正在經歷如此的輪回,部分互聯網應用供應商收集用戶隱私后,對此加以分析利用以“精準營銷”的方式盈利,回過頭來再沾沾自喜的說我提高了用戶體驗。
對社會學家來說,可以從這張熱點話題清單看到數以億計的人們的喜好憎惡,甚至他們的思考習慣。而這種思考習慣,每時每刻都由計算機記錄,最終形成海量的數據。但對于用戶來說誰愿意自己的隱私被“公示”?誰愿意被人“收集思想”?但對于勢單力薄的普通用戶而言,輸入法、搜索引擎又不得不用,也希望這些工具更好用,但隱私泄露的憂慮總是揮之不去。由此看來,如何通過法律監管等手段加強對上網用戶隱私的保護才是當務之急。