谷歌和微軟的學術量表

知識新知 09/01/2011


學術出版數量日益龐大,過去就有付費的資料庫提供資料分析,最近谷歌微軟兩大網路巨擘也插手市場,提供免費的服務。

今日要描繪科學界面貌比過往容易許多,Google和微軟等公司都提供免費軟體,讓研究者能分析論文引用統計數據、以圖表呈現研究網站,亦可追蹤最熱門的研究領域。

諸如湯森-路透以及愛思唯爾其實都推出付費學術資料庫Web of Knowledge和Scopus database,但科學家與研究機關假若無力或不願花錢,這些免費程式都頗具吸引力。

Google Scholar Citations (GSC)服務於二○○四年推出,用以搜尋學術出版文獻,日前增加新功能,讓研究人員建立個人檔案,在資料庫內列出他們自己所有論文條目,並呈現每篇論文長期受引用次數起伏變化,再加上如熱門的H-指數等其他數據,要衡量個別科學家的學術產能及影響力。這項服務目前尚在測試階段,採邀請試用制,未來準備開放所有研究者使用。

微軟公司則於二○○九年推出類似服務Microsoft Academic Search(MAS),有類似GSC的工具,過去幾個月還陸續附加新的工具,包括以圖表記錄引用網絡、發表趨勢、各領域知名研究者排名等。

雖然微軟版本功能較多,Google的GSC服務在規模上極具優勢,研究人員表示,後者數據更正確、更可靠,且收錄文獻更多,甚至超越Web of Knowledge or Scopus等付費資料庫;相較於此,微軟MAS版本服務只收集研究者部分發表論文,夏威夷大學資訊科學家賈斯柯(Péter Jacsó)指出,可能導致引用數據「異常微小」。

微軟學術合作部門主管德克(Lee Dirks)表示,「這項學術服務目前尚在起步」,今年三月至六月間,內容從一千五百七十萬件增至二千七百一十萬件,未來也會持續增加;澳洲墨爾本大學的哈辛(Anne-Wil Harzing)則研發其他工具,從Google 的GSC服務汲取引用資料,她認為微軟版本仍「極具潛力」。

有些研究人員質疑,純粹使用電腦程式,完全不經人力整理與確認,是否能建立可靠的資料庫與引用數據,賈斯柯指出,兩家公司使用的軟體有時會收集到錯誤資訊,例如誤判作者姓名或身分。

參與GSC及新數據系統的幕後工程師阿查亞(Anurag Acharya)反駁,強調系統早已處理這些問題,最近還明顯改進,故搜尋結果「愈來愈好」;哈辛另提到,批評者太過著重於極端錯誤,她認為Google版本服務整體錯誤比率很低,不會嚴重影響H-指數等重要數據計算結果。

相較於付費資料庫,Google Scholar另一優勢在於涵蓋眾多書籍及會議論文集,前者對社會科學及人文領域很重要,後者則在電腦及工程領域很普遍,荷蘭萊頓大學科學與科技研究中心專家范朗(Ton van Raan),唯有包括這些刊物,才能產出正確數據。湯森-路透公司產品研發主任漢蒙德(Joel Hammond)指出,該公司資料庫已納入論文集,也預計於今年秋天加入書籍引用索引;其他付費產品亦有類似計畫。

但Google和微軟皆不認為自己和付費資料庫直接競爭,德克表示,「這些服務與競爭無關,而是提供學術研究開放平台」;生於印度的阿查亞則著重於人道目標,希望這些服務不是僅供闊綽的機構使用,覺得這項Google服務能夠在貧國研究人員之間日益普及,令他備感滿足。

漢蒙德表示,湯森-路透公司篩選收錄內容的標準比免費服務更嚴格,故計算分析更加可靠,但其他人表示,免費服務最終也可能達到許多使用者的要求;美國華盛頓大學生物學家博格斯多(Carl Bergstrom)認為,「免費服務開放所有人使用,自然就有其優勢,若能持續發展,就可能威脅到付費資料庫」,他目前則與微軟及湯森-路透合作分析學術引用資料。

范朗亦有同感,他表示,「未來付費與免費服務之間,競爭必然會日益激烈」。
【知識通訊評論月刊一○七期】2011.09.01

« 誰怕美國倒債∣回首頁∣更嚴重的乾旱迫在眼前 »