隨著網絡信息的飛速發展,科技新聞這一重要科技資源形式發揮著越來越重要的作用。如何對海量的科技新聞進行聚合已成為新興的熱點話題。文章介紹了新聞聚合的產生,并將現在廣泛使用的新聞聚合模式歸納為:人工編輯組織、Digg、Google news、Techmeme四種模式;選取其中最具代表意義的Techmeme模式和Google news模式進行了詳細論述,運用SWOT分析方法,從二者內部的優勢、劣勢、外部的機會和威脅四個方面進行分析,并在此基礎上提出了二者之間存在的十二方面的主要差異;同時科技新聞的聚合方式對圖書情報行業的信息聚合方式也有一定的借鑒意義。
關鍵詞:信息聚合,新聞聚合,科技新聞,Google news模式,Techmeme模式,數字圖書館
隨著網絡的日益普及、網上信息數量的迅猛增長,互聯網已經成為人們獲取知識的重要信息源。電子科技新聞,這一重要科技資源也在廣大科技工作者的工作中發揮著越來越重要的作用。但是,在網絡中有用信息大量增加的同時,無用的冗余信息也隨之增加,這就給科技工作者準確迅速獲取有效信息帶來了一定困難:為了滿足日常工作的信息需求,科技工作者們不得不花費大量的時間去搜索、瀏覽,從搜索引擎提供的大量信息中逐條篩選有效信息。為了解決用戶因盲目點擊和無目的閱讀所耗費的大量時間和精力的問題以及如何為用戶提供所
關注領域的最新信息,聚類技術應運而生了。但應采用哪種聚類技術,采用何種聚合方式至今仍是科技界探討的熱點話題。
1 新聞聚合
1.1 新聞聚合的產生
新聞聚合(News Feeds),是一種新興的網絡信息聚合技術。新聞聚合工具是將新聞按不同的話題進行分類、聚合,最后把符合要求的新聞推送給讀者的一種工具。通過新聞聚合工具的使用,讀者可以快速方便地瀏覽到自己關心的新聞。新聞聚合的思想產生源于美國2001年爆發的“911”事件。美國“911”恐怖襲擊事件后,互聯網上關于“911”的相關新聞的需求突增,導致不少新聞站點因無法承受流量壓力而罷工。Google也不例外,一時間,關于“911”相關新聞的搜索需求量突增到平時的60倍。為了應對這一突發事件,Google采取了緊急應對措施:把大型新聞網站上與“911”事件相關的鏈接集中存放在Google首頁,以方便讀者查詢。這是Google News的雛形,在此舉措的啟發下新聞聚合思想誕生了。
1.2 新聞聚合的方式
互聯網發展至今,網絡信息已經成為大眾獲取信息的重要渠道之一,同時用戶對信息的需求在數量和質量上都有所增加。因此各大網站紛紛采用了各種各樣的聚合技術,以期為用戶提供更為便捷、有效的信息服務?v觀新聞聚合的發展歷史,綜合分析對比當今各大網站采用的聚合方式,其聚合思路可以歸納為以下四種:人工編輯組織聚合;Digg類的投票社交聚合;以Google為代表的語義聚合;以Techmeme為代表的link聚合。
- 人工編輯組織聚合:人工編輯組織聚合方式其信息內容主要依靠專業編輯多年積累的經驗及自身的新聞敏感度,并參考點擊量、閱讀數量、推薦指數、評論指數等機器統計數據,從而確定并向讀者推薦當日的重要新聞(焦點新聞)。具體的新聞內容需要通過專業編輯的審批,需有專業人員維護。國外的雅虎及國內的大多數門戶網站都是采用此思路。
- Digg類的投票社交聚合:Digg類投票社交聚合主要是依靠網友的力量對資訊進行篩選、推薦、投票,根據投票和推薦結果的統計,生成相應的內容。其信息排行幾乎不人工干預,由讀者參與決定新聞的重要度和推薦度。如我國的抓蝦和鮮果。
- Google news:Google news是機器聚合的代表,它依靠機器語義分析,從海量的互聯信息中找到相匹配的新聞鏈接,以一定的顯示方式全部推薦給讀者,再由讀者自行挑選自己關心的新聞。百度新聞、雅虎News也是采用這種聚合方式。
- 以Techmeme 為代表的link 聚合:Techmeme分析的對象包括新聞、博客、視頻、圖片等多種方式,它不僅向讀者推薦新聞本身,還會把有關該新聞的評論、不同或類似觀點及后續觀點等一系列新聞背后的有價值的新聞,經過綜合分析后再推送給讀者,可以使讀者全面了解所關注新聞的背景、不同的觀點及后續發展等情況。它很好地反映了信息的連續性和回放性。國際上使用這種方式的網站并不是很多:首創者美國的Techmeme仍是科技新聞翹楚,其跟進者中國的玩聚網,發展并不成熟,影響力不是很大。在科技新聞領域中,上述的四種模式應用最為廣泛的當數Google news的科技新聞和Techmeme。其中, 依托于Google 強大搜索功能的Google news,充分利用搜索引擎本身便捷、快速、全面的特性,很好地彌補了新聞內容過于分散的缺陷。而Techmeme則是最先采用“依靠分析挖掘link發現熱點”的新聞聚合模式。隨著信息傳播領域的焦點從人工編輯轉向機器聚合,Techmeme以其抓取速度快、內容全面和閱讀效率高三大優勢成為最受關注的熱點話題。
2 Google news模式與Techmeme模式比較研究
2.1 Google news聚合模式概況
Google News(谷歌版叫“資訊”) 采用的是機器過濾關鍵字的聚合方式。它是當時的首席科學家Krishna Bharat在“911”事件的啟發下,對其雛形進一步完善形成的,他將不同新聞源的新聞聚合起來,這樣用戶就可以方便地看到不同媒體關于同一新聞的觀點和報道。
但是,隨著讀者需求的縱向加深,Google news這種單純的新聞事實收集方式已不能滿足需求,他們更希望了解的是新聞背后的“故事”。對此Google積極采取了改進措施:
2006年Google推出了定制搜索引擎,通過它網站和Blog發布者能夠為讀者提供更具相關性的搜索結果。通過選擇關鍵字和發布者想要在搜索列表中包含的站點列表,用戶可以實現以下功能:①只搜索某些站點;②最先搜索某些站點;③排除某些站點。這個定制的搜索引能夠入駐用戶選擇的站點,搜索結果可以根據用戶的喜好以不同風格、不同語種顯示。
2007年Google news引入了當事人評論機制,增加了新聞信息的豐富度。這種機制將傳統媒體機構采集的新聞與新聞當事人的評論相結合,在提供新聞的同時也提供原創價值信息和新聞鏈接。Google正在積極引入人工參與的模式,以彌補機器聚合帶來的缺陷。
2.2 Techmeme聚合模式概況
Techmeme的前身是2005年推出的memeOrandum,經過幾年的發展完善,Techmeme已經成功突破博客社區這個“小圈子”,上升為一個主流的科技新聞網站。Techmeme主要關注科技話題,實時監測已定義的Blog列表,通過掃描傳統的新聞媒體和博客(側重于科技類博客)的 URL鏈接來挖掘博客作者之間的對話線索,識別出哪些新聞是重要的,并將相關的新聞信息整理后,以對話的形式展現在首頁上,便于用戶閱讀。其中,這個 Blog列表是前一個月內被 Techmeme 采用頻率最高的100個站點的列表,此列表包含所有權威的科技新聞源和一流的Blog。
Techmeme是一個非常有效的內容過濾器。首先,Techmeme的聚合是高度相關的,能夠毫無遺漏地發現當日所有基于Blog和IT媒體的科技新聞熱點。其次,Techmeme的時效性非常強,一般文章發布15分鐘后,就能被抓取到。再者,Techmeme具有引發討論、創造熱點的功能。 Techmeme能在Blog的非正式討論中發現未被報道的新聞熱點和未來的新聞趨勢,通常情況下幾天后這些新聞就會出現在《紐約時報》等主流媒體上。正如TechCrunch創始人邁克爾·阿靈頓(Michael Arrington)所說的那樣“從某種程度上講,Techmeme可視為博客圈的日報”。這也是Techmeme成為科技工作者必看站點的原因。
2.3 Google news與Techmeme模式的SWOT分析
Google news和Techmeme都是當前最優秀的新聞聚合工具,但它們本身并不完美,仍需改進。為了使Google news和Techmeme的優缺點更加清晰,筆者運用SWOT分析方法分別對二者的競爭優勢(Strength)、劣勢(Weakness)及外界存在的機會(Opportunity)和威脅(Threat)進行了深入的分析,詳見表1和表2。
2.4 Google news與Techmeme模式的差異分析
通過對比表1和表2中兩者所處的外部環境,可以看出:Google news與Techmeme都處在一個網絡媒體快速增長、傳播范圍日益廣泛、受眾人數劇增的時期,這一機遇為新聞聚合媒體的發展提供了更加廣闊的空間。但與此同時,他們又都面臨著來自其他同行業廠商的激烈競爭。將兩者自身的優勢和劣勢交叉對比后發現:Google news與Techmeme之間存在很大的差異,主要表現在以下方面:
- 搜索功能。Google news擁有強大的搜索功能。而在Techmeme網站內沒有設置檢索入口,這一缺陷是其最大的軟肋。
- 新聞來源。Google news的新聞主要來源為主流報紙,沒有考慮其他新興的新聞形式,如博客。Techmeme融合了新聞和博客兩大新聞源。
- 新聞的時效性。兩者的新聞時效性不同,Google news可以顯示已經發布18到20小時內的新聞內容,而讀者可以在Techmeme上找到15到30分鐘前新聞媒體或博客發布的最新消息。
- 新聞的可定制性。Google news可以依據讀者的興趣與愛好定制不同的新聞;而Techmeme只顯示最新的熱點新聞,讀者沒有自主選擇的權利。
- 頁面顯示。Google news采用的是限量顯示方式,即每頁最多可以顯示十條新聞,而Techmeme采用的是分層、滾動的顯示方式,通過這種方式讀者可以方便地追蹤、參與話題討論,且新聞顯示的條數不受限制。
- 新聞重復性。Google news的新聞主要來自主流報紙如美聯社、新華社等媒體網站,而這些網站的新聞報道的重復現象很嚴重,因此Googlenews不可避免的會有大量的重復新聞存在。與之相比,主要聚合來自博客內容的Techmeme,重復信息相對較少。
- 新聞存檔功能。Google news沒有新聞存檔功能,加上它的新聞變化頻率高、每頁顯示的新聞數量少,讀者一旦錯過某條新聞,就很難再找回。Techmeme為讀者提供了完善的存檔功能,只要輸入日期和時間,就可以看到當時的頁面。
- 新聞的權威性。從2007年開始Google news采用了邀請新聞當事人的評論機制,但評論的權威性難以保證。而Techmeme的觀點來自權威的主流媒體及博客(這些博客的博主大多是行業的專家或權威人士),這一方式保證了新聞的準確性和權威性。
- Techmeme具有的Track功能,用戶可以通過RSS訂閱方式來跟蹤某個熱點。這正是Google news所欠缺的。
- Techmeme在對新聞進行聚合的同時也引入了對photo和Video的聚合,暫時沒有跡象表明Google news具有此功能。
- 頁面更新頻率。除上述十個方面外,Google news和Techmeme在頁面的變化頻率上也有很大的區別,Google news界面每幾分鐘就會變化一次,雖然Techmeme的新聞也在變化,但變化的頻度沒有Google news那樣快。經過一段時間的跟蹤觀察,發現Google news的頁面每幾分鐘就會更新一次,如在2008年3月18日筆者于11點14分采集到了剛剛更新的新聞頁面,五分鐘后其頁面有發生了更新,且除了“微軟Vista SP1將于明日發布亞馬遜網站開售”這一條新聞外,余下的13條新聞均已發生了變化。2008年3月25日13點39分筆者第一次采集到了 Techmeme頁面上剛剛更新后的新聞,二十分鐘后再次采集到更新后的內容,主頁面上的新聞內容并沒有更新,僅右邊一欄中的“最新發現的新聞主題”的部分內容發生了變化,并且它發布了6分鐘以前剛剛發生的最新消息。
- 服務對象。Google news的科技新聞是以大眾為服務對象的,它沒有十分明確的客戶群體的區分,而Techmeme主要是針對科技博客作者、科技新聞工作者和科技工作者的一種新興的信息聚合方式。
隨著閱讀需求的深化,讀者不再僅僅需要單一的新聞信息,而是應該包含評論、觀點和更多輔助信息,Techmeme非常恰當地迎合了科技讀者對“新聞”和“觀點”兩方面內容的閱讀需求,相對來說,Techmeme更適合科技新聞的聚合。分析兩者的劣勢可以發現,和Google news相比,雖然Techmeme在品牌及市場占有率上暫時處于劣勢,但其迅速提升的市場占有率及客戶群體的迅速增加,已引起了Google的高度注意。雖然Techmeme暫時局限于美國市場這個小圈子內,但是其國外科技讀者的數量正在以幾何級數的速度增長。面對外界的同樣的機會和威脅,誰能更好、更快地彌補自己的缺陷,誰就更有可能成為未來駕馭科技信息聚合領域的最強有力的方式。
3 啟示
通過上述研究發現,Google news和Techmeme這兩種聚合方式各有利弊;ハ嗳¢L補短,在兩者之間尋找最佳的可能組合,是今后新聞信息聚合最理想的方式。
同時Techmeme模式和Google news模式的組合對改善圖書情報行業的信息聚合服務方式也具有一定的借鑒意義。
首先,科技工作者的信息要求的加深,已有的被動信息查閱的方式已不能滿足要求。當今社會,信息更新速度越來越快,科技工作者需要第一時間掌握本領域最新研究動態,以便及時調整研究重點。而大部分科技工作者工作繁忙,他們不可能將大量的時間用于跟蹤國際最新動態。如果能提供一種實時跟蹤工具,并把跟蹤結果經過去重等一系列初步處理后,推送給科技工作者,一定會受到歡迎。而Techmeme快速準確的信息聚合方式很好地滿足了這一要求。
其次,隨著學科劃分的不斷細化,研究領域的不斷拓展,科學研究的范圍越來越廣闊,但對每位具體的科學研究人員來說,他的研究領域在短時期內是不會變動的,也就是說在一定時間內每位科技工作者只對某個很小領域內的科技信息感興趣。因此,針對性很強的科技信息才是科技工作者真正需要的,Google news的信息自主定制功能很好地滿足了這一需求。
再者,對于新進入某領域的科技工作者來說,他們需要了解該領域的研究狀況,這就需要對一定時間內的信息進行回溯,這也是現在圖書館保留大量歷史信息的原因,Techmeme具有的歷史存檔功能很好地解決了這一問題。
現階段,無論Techmeme的聚合模式還是Google news的聚合模式都不是很完善,因此在圖書情報機構進行信息服務時,應綜合考慮這兩種模式的優劣,結合本行業的具體情況,取長補短是今后的發展思路。
4 結論
隨著讀者對非官方內容的閱讀需求、讀者閱讀信息的分化和深化、信息的日益豐富、信息獲取手段多樣化及用戶參與新聞選擇的呼聲不斷高漲,Digg、 Techmeme、Google news等新聞聚合方式應運而生。不管哪一種新聞聚合模式,都是為讀者服務的,誰能夠提供最高效的閱讀方式,誰就能最大程度地爭取到用戶,最大范圍內開拓自己的市場,成為科技新聞聚合的主流。同時科技新聞聚合模式對圖書情報的信息聚合服務方式也有一定的借鑒意義,如何取長補短,找到最佳的組合是今后研究的重點課題之一。
參考文獻
[1] DAS A S, DATAR M, GARG A, RAJARAM S. Google news personalization: scalable online collaborative filtering[J]. WWW 2007 / Track: Industrial Practice and Experience, 2007, May: 271-280.
[2] RADEV D R, OTTERBACHER J, WINKEL A, BLAIR-GOLDENSOHN S.News inessence: summarizing online news topics[J]. Commun. ACM, 2005,48(10):95-98.
[3] CLEUZIOU G, MARTIN L, VRAIN C. PoBOC: An overlapping clustering algorithm, application to rule-based classification and textual data[C]//Proceedings of the 16th ECAI conference, 2004: 440-444.
[4] 戴維民. 網絡信息優化傳播導論[M]. 上海: 復旦大學出版社,2004(18): 150-175.
[5] 劉學. 中國網絡新聞媒體研究[J]. 新聞與傳播研究, 2002(1):26-34.
[6] 約翰遜·托馬斯, 凱·芭芭拉, 譚辛鵬. 互聯網與傳統媒介信息可信度的比較[J]. 國際新聞界,1999(05):12-18.
[7] 王利. I T新語林:簡易信息聚合[ J ] .計算機教育, 2 0 0 5 ( 0 8 ):63-64.
[8] 王娜.博客搜索引擎與傳統搜索引擎的比較研究[J].圖書情報工作, 2006(07):54-57.
[9] GEORGE C, SCERRI J. Web 2.0 and User-Generated Content: legalchallenges in the new frontier. Journal of Information, Law and Technology[J],2007(2):1-22.
[10] 趙偉.網絡傳播中的博客研究[D]. 湖北:華中科技大學,2005.
[11] 譚芳.網絡新聞評論研究[D].湖北:武漢大學,2005.
[12] 孫及園,林錦賢.對Web網頁的查詢及信息提取[J]福州大學學報(自然科學版), 2000(03):93-97.
[13] 鳳飛偉.網絡新聞評論及其發展趨向研究[D]. 江西:南昌大學,2005.
作者簡介
程文娟(1982-),研究方向:科技資源整合。通訊地址:北京市復興路15號中國科學技術信息研究所研究生部 100038
彭潔(1965-),研究員,主要研究方向:知識管理、信息資源整合。通訊地址:同上
趙輝(1971-),工程師,主要研究方向:信息資源管理。通訊地址:同上
來源:http://www.biaodianfu.com/google-news-model-and-techmeme-model-in-scientific-news-feeds.html