维基百科:《维基人》/第十四期/新聞和期刊摘錄
新聞和期刊摘錄
路標:德語維基文庫結束了長達15年的校對計畫
(本文部分摘錄自英语维基百科雜誌《路標》2020年7月號新聞版塊)
德語維基文庫社群日前完成了重要德語傳記叢書《德意志人物誌》的線上版本,約包含26,345篇條目。完成此一計畫所需的工作包括更正、校對在其他地方發布的光学字符识别(OCR)掃描文本,並需經四眼原則確認,以符合社群的品質要求。事實上,數位化《德意志人物誌》計畫啟動的時間點還先於德語維基文庫本身正式獨立的時間點,早在德語維基文庫於2005年自維基文庫孵育場(wikisource.org,時為sources.wikipedia.org)分離之前就已經開始。儘管費時15年之久,本計畫仍較當年初版《德意志人物誌》紙本出版的速度快上許多,後者整整花了37年,自1875年一路到1912年才出版完畢。在本計畫進行的同時,另一個由政府資助的計畫亦完成了《德意志人物誌》的數位化,不過德語維基文庫社群成員、檔案學家克勞斯·格拉夫聲稱由社群完成的版本品質較好。
《德意志人物誌》的後繼叢書《新德意志人物誌》於1953年出版首卷,全套叢書預計將於2023年完成。自2010年起,德語維基文庫社群亦已經準備開始對《新德意志人物誌》的數位化工作,但基於目前的著作權法律限制,可能要等到22世紀,整部《新德意志人物誌》才能全部進入公有領域。
維基媒體研究通訊:維基百科如何跟進COVID-19的研究
(本文部分摘錄自元维基雜誌《維基媒體研究通訊》2020年6月號)
荷兰阿姆斯特丹大学的一名研究人员乔凡尼·科拉维扎(Giovanni Colavizza)近期在开放获取预印本数据库bioRxiv预发表了一篇有关维基百科上的2019冠状病毒病疫情相关条目的論文〈維基百科中的COVID-19研究〉(COVID-19 research in Wikipedia),介绍了维基百科的编者是如何搜寻整理有关信息的。自疫情爆发以来,(英语维基百科)已有大约20,000篇有关条目创建,那么这些条目是如何保证质量的呢?
筆者自PubMed、bioRxiv、WHO等公開可獲取的資源中建立了代表COVID-19研究的語料庫,總共包含60,000多種出版物。為了確定這些出版物是否已經運用在維基百科的條目當中,筆者調用了Altmetric的資料,檢查維基百科條目中引用文獻的出版物標識符(例如DOI)是否匹配。
藉此,此研究得以深入解析維基百科中COVID-19相關編輯工作的一些趨勢。首先,編者們似乎有餘力應付數量迅速增加的相關文獻。根据统计,大约3%的出版物至少被维基百科引用过一次。考慮到2020年的出版物數量較往年增長了10倍以上,此一數據對於近年來出版的出版物而言更加符合。第二,編者們在主題多樣性方面引用了大量具有代表性的文獻樣本。將這些文獻以隐含狄利克雷分布模型分為7個主題後,可以得知各個主題在維基百科中的覆蓋範圍反映了科學文獻的整體失衡(多數研究以冠状病毒和公共衛生及流行病為研究主題)。第三,編者基本遵循與2020年以前相同水平的參考資料品質標準(參見《醫學可靠來源指引》[編輯組註:此處指英文維基百科,中文維基百科本地的《醫學可靠來源指引》日前甫成為正式指引]),多數依靠具有影响力(例如曾被新聞或部落格提及),且在经过同行评审的專業期刊(例如《刺胳針》)裡出現的研究,同時較少使用預印本文獻。
此研究的主要限制之一是僅包括了維基百科條目中對科學出版物的引用情況。因此,未來的研究方向包含維基百科的條目內容、條目的編輯歷史,以及將維基百科與專家對COVID-19的評論進行比較。
附錄:〈維基百科中的COVID-19研究〉導言
维基百科是互联网上的主要知识来源之一。在(COVID-19)大流行的头几个月里,(英语)维基百科创建了超过4,500条有关COVID-19的条目。截至4月初,这些条目大约获得了2.5亿次阅览。自COVID-19疫情爆发以来,关于COVID-19本身以及疫情发展的文章不断在线发表。维基百科(相关条目)的内容基于以科学文献为主的可靠来源。考虑到目前的危急形势以及维基百科所扮演的公众角色,依靠具有代表性的、可靠的科学结论就显得十分重要。笔者对维基百科中COVID-19相关條目的引用覆盖面进行了评估,结果表明维基百科的编者能很快将最新的研究成果整合到条目中。此外,他们能从关于COVID-19的最新研究中选出最具代表性的文章,使条目能够体现相关研究的全貌。在以文章为层次进行评估后,笔者发现本文讨论的所有主题基本都能在维基百科中得到合理的呈现。笔者还使用了回归分析的方法建立了关于维基百科引用的模型。结果表明,尽管跟上最新研究不是一件容易的时期,维基百科编者通过依靠经同行评审、高引用數、在社交媒体中得到广泛转发的文章(完成条目的编写)。