社交媒體隱藏了哪些秘密?
電腦專家鞏志國教授逐一解構

文、圖:校園記者梁馨元

對澳門大學電腦及資訊科學專家鞏志國教授來說,社交媒體都是寶,每一個用戶的社交腳印都如淘金沙般珍貴。“社交媒體上的定位顯示,時間顯示以及資訊分享,都可以用作大數據分析的基礎。以這些為例向非電腦專業學生普及大數據知識,明白其如何影響他們的生活,我覺得是最有成就感的。” 鞏志國教授說。

鞏教授於午餐時段跟書院學生分享《社交媒體挖掘》,講解大數據的生活性與普及性,以鼓勵同學運用其進行跨學科應用。

鞏志國教授跟學生分享社交媒體挖掘技術

小軟體中的大數據

隨著社交媒體種類越發多樣,註冊用戶越發廣泛,分享文化越發狂熱,社交媒體上公開的資訊逐漸堆積形成數據,鞏志國教授便看中了這堆積的“金山”。“這張照片於何時何地拍攝,用戶評論表達的是對某個景點的喜愛還是嫌棄。僅僅是這些資料就可以回答許多問題。去一個地方大家最喜歡去哪兒,最代表的景點是哪兒,如何歸納路線最節省時間?這些都是旅遊公司時常思考的問題。而大數據分析使得這些答案更加精准。” 鞏教授說道。

此外,大數據還可幫忙調查當地時事,甚至預測用戶行為“我們在法國巴黎成功分析了環法自行車賽的舉辦時間。因我們進行大數據分析後發現大多數遊客沿著塞納河橋轉了個圈,然後聚集到凱旋門。原來橋拐彎的地方就是自行車轉彎的地方,好多人過來圍觀並拍照。最後到了凱旋門。而使用者的行為時間顯示與比賽時間剛好吻合。而另一次我們分析總結出大部分遊客去三藩市路線圖後,預測其他也去三藩市遊玩的旅客行為,發現旅行足跡也幾乎吻合。”

“今日頭條會根據使用者歷史流覽資訊推測使用者喜好,推薦符合使用者的新聞,YouTube頻道則推薦視頻,淘寶推薦類似商品,這些都是大數據與我們生活息息相關的鐵證。而社交媒體的資料只是眾多資料的冰山一角” 對此,鞏教授總結道:“大數據作為實踐應用,因大學生們使勁研究理論而被忽視了。電腦專業學生覺得只涉及應用不想深究,非電腦專業學生又抱怨程式設計複雜。但大學生更應去瞭解應用大數據,而不是對技術敬而遠之,將技術束之高閣。”

鞏志國教授視社交媒體推積的資訊為一座“金山”

大數據為學科橋樑

由於大數據技術運用的需求增加與求簡,實際運用比想像中的更加簡單,“不需要你掌握多高的程式設計技術與基礎,網上許多軟體如R語言,Python ,Spss甚至是Excel都可以進行大數據分析。阿里巴巴的Linking‘連線’ 工程師就不需程式設計。將資料拉來編成文本文檔拉入軟體。軟體會將文本分詞,用演算法去理解文本結構從而確定語義。如今分析大數據的工具,都走簡單明瞭的路線。” 鞏教授鼓勵學生說。

不只是企業可以運用大數據,真正受大數據分析影響的成果已跨學科實現,馬萬祺羅柏心書院院長許德寶教授在介紹邀請鞏教授舉辦這次講座目的時提到,不只是企業可以運用大數據,真正受大數據分析影響的成果已跨學科實現,“教育學可用於收集學生學習的錯誤資訊形成資料庫。作為資料庫研究。或中文研究與大數據結合,研究語言變化。以往從前學術界一般理論認為白話文是1919年形成的,如今用大數據分析海量材料後發現,早在18世紀末中國開放後新的白話文語法便開始運用,這是一次理論的革新。”

許德寶教授(左)和鞏志國教授合照

培養大數據人才是新趨勢

澳大在2018年成立了數據科學中心,8月獲國家科技批准成立“智慧城市物聯網國家重點實驗室”,旨在推進大數據在各產業層面的應用研究。澳大目前正籌備開辦有關數據科學的碩士課程,整合跨學科的專業,例如機器學習、精準醫學和互聯網金融等,以回應社會的需求,協助本澳建設為智慧城市,為就讀不同專業領域的本科生擴大升學選擇,積極及有規模地培訓本地大數據應用人才。鞏教授認為修讀大數據的學生可以來自不同的領域,進行跨學科的學習,他說:“培養大數據人才是社會趨勢,培養出來的學生可以在不同的行業發展,而不同專業的學生都可以學習大數據,可以促進跨學科的學習,這是一種新的趨勢。”