科學論文的中文姓名危機

專題報導 03/01/2008



中國科學家發表的論文與日俱增,但是他們是否有得到應得的名聲與認同?如果他們的名字被搞混了就不會。

上海交通大學藥學院副院長賈偉對於數百種新陳代謝的路徑嫻熟於心,但是卻被他院內研究生發表的論文搞得暈頭轉向。他有三名學生,分別是王曉豔、王小榮跟王小雪,他們的中文名字完全不同,但是都用同樣的縮寫名字「 X. Wang 」發表文章。賈偉嘆道,分辨論文誰屬大不易。

如果有個約翰‧羅伯特 (John Roberts) 跟珍‧羅伯特 (Jane Roberts) 在同一間實驗室裡共事,並且都用「 J. Roberts 」之名發表文章,類似的混淆也會發生。但是要在以英語發表的論文裡改寫中國字,以及隨著人口成長,幾個大姓使用過度,這些挑戰讓中國學者的認名問題更為棘手。中國公安部估計,有超過十一億人(佔全中國大約百分之八十五的人口)共用僅僅一百二十九個姓。縮寫、姓名排序、以及各期刊譯名不一致等的問題,都讓混淆情況更為加劇。

「分辨論文誰屬大不易。」 —- 賈偉

中國學者在英文期刊發表文章時,會透過拼音羅馬文字化系統,利用拉丁字母將其名字轉化成一套能夠代表中文聲音的音譯版本。然而這套做法卻不是雙向的一對一關係,舉例來說,「王」跟「汪」這兩個中國姓氏,都可以被「拼」成「 Wang 」。而中國學者不但同姓,還擁有同樣的名字縮寫的人多不勝數,讓問題更形嚴重。在美國國家醫學圖書館負責主持管理的生物醫學資料庫 PubMed 上,搜尋由「 Wang X 」發表的文章,結果會跑出八千九百零四項搜尋結果,而這數字幾乎每天都還在增加。

這個問題不是只有中國人才會碰到。宗旨為促進生命科學國際研究,位於法國史特拉斯堡的「人類科學計畫」,其主席伊籐正男 (Masao Ito) 表示,日本與韓國姓名以英文發表時,也會碰到相同的問題。因此學者跟編輯使用搜尋引擎跟論文資料庫時,難以找到亞洲作者,這並不令人感到意外。伊藤正男說,亞洲學者因此比較不會受邀參與合作計畫,或是擔任同儕審查的工作。

出版社處理亞洲姓名的規則變動不一,讓情況更為惡化。舉例來說,各期刊縮寫多音節亞洲姓名的方法便有不同;賈偉說倘若各期刊把名字裡的所有中國字都縮寫,比方說「小榮」寫成「 X. R. 」,「小雪」寫成「 X. X. 」,而不是只寫成「 X. 」,就有助於分辨各學者發表的作品。賈偉表示,他們要評鑑研究者表現或是數人頭時,縮寫問題就會變得特別麻煩。

同樣地,有些期刊堅持要把名字置前,姓氏在後,而其他期刊卻容許作者以母國的傳統呈現姓名。舉例來說,兩名先前於北京清華大學研究奈米碳科技的研究員,分別叫做魏洋跟楊衛;現在任職於杭州浙江大學的楊衛表示,清華大學不但有好幾名研究員跟他的名字一模一樣,還跟好幾名研究其他奈米碳領域的人,有同樣的姓名縮寫。他說你若能找到你在找的學者,算你走運。

這問題已經普遍到有些學者會從中獲益。外科醫師劉輝在自己的履歷表裡,塞進了另一名跟他同姓,名字縮寫也一樣的學者著作,從而在卓越的北京清華大學混到助理院長的職務;不過最後還是東窗事發,北京清華大學在二○○六年三月將他開除。

美國物理學會研究期刊主編史普勞瑟 (Gene Sprouse) 表示,如果連亞洲人都無法分辨他們自己國內的學者,對西方人來說就是難上加難了。他說他詢問手下編輯群為什麼亞洲審查者那麼少,他們回答說這是因為亞洲學者的姓跟名字縮寫相同的太多了,很難找出適合的人。他還補充說,這問題只會隨著亞洲作者發表愈來愈多的論文而愈形嚴重。

中國、日本跟南韓發表論文的數量,近年來成長快速,二○○六年已佔湯姆生科學引用指數 (SCI) 有編目之科學文獻的五分之一,這大約是美國的三分之二。中國大陸作者發表 SCI 有編目的論文數成長特別快速,一九九六年時僅佔百分之二點三,到二○○六年已達百分之八點四。

字裡行間

為了因應這股潮流,美國物理學會非常罕見地讓作者自己決定,是否要以中文、日文或韓文列名,再加上英文版的譯名。史普勞瑟表示這不僅僅是出版問題而已,而是人名確實很重要,此舉意在宣示他們尊重亞洲同事,歡迎他們來投稿。美國物理學會可能會讓阿拉伯文之類的其他語言,也享受同樣待遇。

「你若能找到你在找的學者,算你走運。」 —- 楊衛

雖然很多人對美國物理學會此舉表示歡迎,有些人還是懷疑其他出版社是否會急著跟進。要印出外文字母,排字員就必須把每一種外文字母的字體跟代號整合起來,徒增成本。還有人質疑此舉本身會有多少幫助,伊籐正男就說只有在論文資料庫採用這套做法,亞洲作者能夠以母國語言被搜尋到的情況下,才會真正產生作用。

這些事情似乎還沒對 PubMed 這類文獻資料庫造成困擾。「國家醫學圖書館」索引部長馬塞提克 (James Marcetich) 表示,他沒有察覺到搜尋亞洲作者的引用有什麼問題。使用者在很多時候可以利用打入關鍵字或是作者所屬機構,縮小搜尋範圍。不過許多研究者每幾年就會換研究單位,不然就是涉足多領域;縮小搜尋範圍的工作,也可能耗時甚久,令人生畏。

荷蘭科技類出版社「愛思唯爾」 (Elsevier) 北京辦公室經理孫曉鵬(音譯)表示,這一切都跟效率有關,一名作者在十五分鐘內就能夠被找到,跟花上六個小時差很多。他懷疑以本國語言進行搜尋能夠有所幫助,因為研究者要以他們不熟悉的語言搜尋名字極其困難。他說愛思唯爾擁有像是 Scopus 作者辨識器這類的工具,能夠提供另外一種辨識擁有相同姓氏作者的方法,對亞洲跟西方作者都通用。 (請參看《知識通訊評論》第二期〈搜尋引擎三雄爭鋒〉一文)

這套在二○○六年上線的作者辨識器,會給曾經於 Scopus 資料庫所涵蓋的一萬五千份期刊,發表過文章的近兩千萬名作者,每人一個獨特的號碼。有一套演算法會根據作者所屬機構、發表歷史、研究領域跟共同作者,分辨那些相似或相同的名字。 Scopus 系統據稱能夠在其百分之九十五的紀錄中,達到百分之九十九的確定性,並且還給每個作者一個網頁,他們可以從中查看其個人資料,並做出修正。孫曉鵬說,這就好比是研究者的護照,無論他們去到哪裡,都會如影隨形地跟著。

愛思唯爾並不是唯一一間提供這類商業產品的公司。位於美國費城的「湯姆生科學」,在今年一月揭露他們的 ResearcherID 系統,可讓研究者創建個人辨識器,管理他們自己的引用統計數字。這套軟體會在一次性的註冊時,分配一個號碼給研究者。湯姆生產品開發部副部長普林戈 (Jim Pringle) 表示, ResearcherID 解決了所有關於發表作品的模糊空間,為虛擬合作提供了一處安全可靠的環境。這套服務目前有三千五百多名受邀試用的使用者。

口徑一致

美國約翰霍普金斯大學應用物理實驗室的圖書員芬格曼 (Susan Fingerman) 認為,愛思唯爾聲稱他們辨識作者的精確度,可能有點吹噓過頭。她表示無論怎麼說,這些做法只能夠部份解決問題,因為作者辨識的問題潛藏在出版業非常上游之處,也就是各期刊處理亞洲姓名的規則根本不一致。她認為各出版社應該一起決定一套統一的作者姓名處理法,唯有如此,作者辨識系統才能真正發揮作用。

然而這些目前市面上的產品,並無法提供跨越所有資料庫的作者辨識。由兩千零四十六家學術出版社,其中包括愛思唯爾跟自然出版集團,所推出的 CrossRef 系統,可能是一種解決之道;這套系統想要引進一種類似電子化文章數位物件辨識器 (DOIs) 的 Contributor ID 。 CrossRef 策略方案主任畢爾德 (Geoffrey Bilder) 表示,一般認為 CrossRef 的用意,是要在某個時間點,給所有作者一個舉世通用的 DOI 註冊碼;畢爾德還表示,無論是演算法還是使用者上線產生內容的系統,都難免會有謬誤, CrossRef 卻能提供授權體制,這對於辨識器是否能夠用於專業目的相當重要。

CrossRef 今年稍後會試用一套原型系統,邀請書籍跟學術文章的作者為其著作註冊。這些由作者列出的發表作品,接著就會連線到出版社的網站取得授權。

王曉豔說,若能有一套世界性的作者辨識系統,也許就能有助於釐清這種讓人混淆的情況。全中國一共有九千三百多萬人姓王,所以她工作的場所或其研究領域裡,出現另一個「 X. Wang 」的機會非常高。她擔心這種辨識錯誤的問題,可能會讓她無法跟西方同行在同樣的立足點上競爭,這會成為她科學職業生涯上的絆腳石。
【知識通訊評論月刊六十五期】2008.03.01

« 跨界研究打破學術藩籬∣回首頁∣雲門和五百億 »