8月21日,已經持續了四個多月的2014阿里巴巴大數據競賽經歷了兩天的現場答辯決出前三名:由北京航空航天大學學生李森棟和中國科學院大學學生王濤組成的“Marvel”團隊獲得冠軍,獲得20萬元冠軍獎金。南京航空航天大學學生柯文瑋的“KLMJV”,南京航空航天大學學生李國拯、徐菁風和東南大學學生肖志宇組成的“Fly402”分獲二三名。
據了解,接下來比賽將進入第三階段——第二階段的前三支團隊的選手將在今年的雙十一參與實戰,與天貓算法團隊正面交鋒,使用真實的第一手數據,讓其算法上線接受真實流量的考驗。
什么才是大數據?是實驗室里電腦里的幾千幾萬條數據?還是論文中的萬條記錄?在答辯現場,選手談論自己參賽以來的最大感受是,通過這次數據競賽,終于可以跟“高大上”的大數據貼身接觸了,這對于他們理解數據挖掘帶來了與以往聽報告、看論文完全不一樣的感觀,這意味著他們從以往大數據研究的“試管捉魚”狀態進入到現在的“入海捕魚”。
阿里巴巴天池項目負責人王一婷向記者介紹,目前學術界面臨數據資源不足、計算能力有限的困境,事實上無法進行真正接地氣的大數據研究。舉辦首屆阿里巴巴大數據競賽,一方面是為高校學子提供大數據的實戰機會,推動高校和研究機構對大數據和算法的研究發展,另一方面也是為了培養相關領域的人才成長。
一位參加2014阿里巴巴大數據競賽的中科大學生在其參賽隨筆中寫到,“大數據時代或許真的已經來臨,起碼'Big Data'已經成為了最近兩年最buzzword的詞匯。但是,如果沒有這次的大數據比賽,就我而言,大數據可能永遠只是一個概念,一個新技術,一個新前沿,幾篇優秀的論文,永遠不會走入我們。”
這次以天貓算法大挑戰為主題的數據競賽是在阿里巴巴大數據科研平臺——“天池”上開展的,比賽通過建立算法模型分析用戶在天貓上的行為日志,建立用戶的品牌偏好,并預測他們在將來一個月內對品牌下商品的購買行為。大賽主辦方阿里巴巴提供了總計5.7億條經過脫敏處理的真實海量天貓用戶行為數據,給選手們供應了真正意義上的大數據,同時給參賽隊伍免費開放ODPS云計算數據處理平臺,讓選手免卻搭建計算平臺的后顧之憂。
根據阿里巴巴提供的資料顯示,十支進入第二階段的高校隊伍來自中國科學院大學、清華大學、香港科技大學、浙江大學等知名大學。有意思的是,與目前中國數據挖掘領域的男女比例現狀保持一致,在最后進入到TOP10排名的16位選手中,僅有一位來自浙江大學的王靜是女性,其余都是男生。
在第一階段比賽階段產生的TOP10隊伍,經過為期兩天的現場答辯后,由專業的評審委員會評選出前三名。評審委員會中包括華為公司諾亞方舟實驗室主任暨香港科技大學計算機系教授楊強、美國密歇根州立大學終身教授金榕、華東師范大學軟件學院教授暨美國喬治亞理工學院計算所計算科學與工程系教授查宏遠、電子科技大學大數據研究中心主任暨互聯網科學中心主任周濤,以及阿里巴巴集團研究員薛貴榮博士等人。
這次“腳踏實地”數據競賽,也獲得了高校和科研機構的強烈反響,據阿里數據顯示,從大數據競賽3月10日宣布報名以來,在短短的一個月內,就迅速吸引了全球14個國家和地區7276支隊伍參賽,經過幾輪的循環競賽,并在8月20日前誕生出了10強隊伍。