...

2億篇論文免費看!「微軟學(xué)術」停用,OpenAlex要接班

2022-01-25

新智元報道(dào)

編輯:David 時(shí)光

【新智元導讀】爲了接替已下線的「微軟學(xué)術搜索」,大型免費學(xué)術索引 OpenAlex 已于今年年初正式上線,它涵蓋 2 億篇科學(xué)文獻,易學(xué)易用,完全免費,網站將(jiāng)于 2 月上線。

最近,大型免費學(xué)術資源索引 OpenAlex 宣布上線,該索引包含超過(guò) 2 億份科學(xué)文獻。

這(zhè)個資源索引服務名爲 OpenAlex,源自古代埃及亞曆山大圖書館館名。

創始人表示,該索引對(duì)出版物來源、作者信息和研究主題進(jìn)行編目,旨在繪制這(zhè)些數據點之間的聯系,以創建一個全面(miàn)的、相互關聯的全球研究系統數據庫。

去年 5 月,微軟宣布將(jiāng)于當年年底關閉學(xué)術搜索知識圖譜(MAG) ,讓一些學(xué)者和其他使用其數據進(jìn)行研究和開(kāi)發(fā)的人感到擔憂。

爲應對(duì) MAG 的下線,位于加拿大溫哥華的非營利性學(xué)術服務公司 OurResearch 利用倫敦慈善機構 Arcadia Fund 提供的 450 萬美元的一部分,創建了這(zhè)項「偉大工程」。

今年 1 月 3 日推出的這(zhè)個免費學(xué)術索引數據庫,功能(néng)上與微軟的 Academic Graph (MAG) 類似,MAG 是 Scopus、Dimensions 和 Web of Science 等學(xué)術訂閱平台的免費替代品,已于 2021 年底停止運營。

據悉,該索引當前通過(guò)可執行複雜搜索的應用程序編程接口或 API 訪問。

微軟「學(xué)術圖譜」接班人

無論是研究人員,還(hái)是開(kāi)發(fā)者,都(dōu)需要大量查閱論文、專著等學(xué)術成(chéng)果。近年來,越來越多的人開(kāi)始繞過(guò)學(xué)術出版商的「付費牆」,通過(guò)多種(zhǒng)手段免費獲取學(xué)術資源。

作爲微軟 MAG 的替代品,此前 OpenAlex 一直在從 MAG 獲得論文、作者和其他數據實體。在 MAG 正式停止運營後(hòu),OpenAlex 開(kāi)始自己從互聯網收集更多新内容。

目前 OpenAlex 已經(jīng)發(fā)布新的 REST API 。與之前下載安裝的方式相比,可以更快、更簡單地訪問 OpenAlex 數據庫,無需賬戶和令牌,完全免費。

目前,通過(guò) API 可以獲取單一實體、實體列表和實體組。

OpenAlex 數據集描述了 5 類學(xué)術實體以及這(zhè)些實際之間的聯系。每類實體分别對(duì)應其目标:

  • 成(chéng)果:包括論文、書籍、數據集等,會(huì)引用其他成(chéng)果

  • 作者:做出成(chéng)果的人

  • 出處:刊載成(chéng)果的期刊或資源庫

  • 機構:(通過(guò)作者)與成(chéng)果相關的大學(xué)或其他組織

  • 概念:以話題方式對(duì)成(chéng)果進(jìn)行标簽

OpenAlex 表示,探索 OpenAlex 數據集的最簡單方法是通過(guò) Web 界面(miàn),無需編寫代碼即可探索 OpenAlex。不過(guò)目前網站開(kāi)發(fā)尚未完成(chéng),預計在今年 2 月上線。

盡管 MAG 已停用,但作爲其繼任者和替代,OpenAlex 將(jiāng)繼續維護 MAG 格式至今年 7 月 2 日,從 2022 年 7 月起(qǐ),OpenAlex 將(jiāng)不再支持 MAG 格式。

由于目前尚處于早期開(kāi)發(fā)階段,各項功能(néng)尚待進(jìn)一步完善,OpenAlex 將(jiāng)每日單個用戶調用數量限制在 10 萬次以下。

OpenAlex 三大優勢

在綜合比較各種(zhǒng)數據庫之後(hòu),小編發(fā)現,OpenAlex 具有明顯的三大優勢,這(zhè)將(jiāng)帶給用戶美好(hǎo)的體驗。

海量數據,覆蓋面(miàn)超 MAG

OurResearch 的聯合創始人賈森·普裡(lǐ)姆(Jason Priem)表示,「OpenAlex 的創立是爲了實現與其他幾個數據庫互聯互通,使其覆蓋更加廣泛全面(miàn)。」

與某個單一數據庫相比,OpenAlex 擁有更加開(kāi)放的獲取覆蓋面(miàn),它擁有來自 Wikidata 标識符、MAG 、ORCID、Crossref、ROR、Unpaywall 等數據資源。

普裡(lǐ)姆表示,「我們不僅可以給用戶提供文章的免費版本,還(hái)可以告訴你該文章的授權和不同版本。」

簡單易用,20 分鍾就(jiù)會(huì)

「OpenAlex 是在用一種(zhǒng)聰明的方式,將(jiāng)大量的數據庫整合在一起(qǐ)。」歐弗頓公司(Overton)的創始人尤安·阿迪(Euan Adie)說(shuō)。

歐弗頓是家總部位于倫敦的公司,主要用于跟蹤政策文件的引用。過(guò)去,歐弗頓公司從不同的來源獲取數據,包括 MAG、ORCID、Crossref,也直接向(xiàng)個人獲取。

現在,歐弗頓隻使用 OpenAlex,寄希望于檢索過(guò)程更加便捷,簡單設置讓人容易學(xué)會(huì)。

「我隻需要 20 分鍾就(jiù)會(huì)使用 OpenAlex,而對(duì)比 MAG 卻要3-4 天。」阿迪說(shuō)。

「我花了大約 2 小時(shí)就(jiù)學(xué)會(huì)了 OpenAlex,而開(kāi)始用 MAG 卻要一周。」另一位使用者 Roar Bakken Stovner 說(shuō)。

Stovner 認爲,對(duì)于更精通計算機的人來說(shuō),MAG 可能(néng)不算難,而對(duì)于那些想要自己嘗試開(kāi)發(fā)小項目的人來說(shuō),OpenAlex 將(jiāng)更容易開(kāi)始。

不用登錄,完全免費

OpenAlex 的底層代碼在 CC0 版權許可下可以免費獲得,任何人都(dōu)可以在其上進(jìn)行開(kāi)發(fā)。

因此,賈森·普裡(lǐ)姆(Jason Priem)表示,OpenAlex 每兩(liǎng)周更新一次,比 MAG 更向(xiàng)前邁進(jìn)了一步。

假如,哪一天 OpenAlex 停止運行,那麼(me),任何人都(dōu)可以從接著(zhe) Priem 停下的進(jìn)度繼續開(kāi)發(fā),而不必從頭開(kāi)始搭建數據庫。

此前,MAG 的用戶必須登錄系統,并支付少量費用,才可以下載。而 OpenAlex 可以免費使用。

普裡(lǐ)姆表示,這(zhè)要感謝 Amazon Web Services 的贊助,不需要注冊或登錄,這(zhè)使得使用過(guò)程更加友好(hǎo)。

不過(guò),OpenAlex 可能(néng)會(huì)考慮爲那些想要超快訪問的用戶,推出付費高級版本。

但,免費的版本總是可用的。

參考資料:

https://www.nature.com/articles/d41586-022-00138-y

https://www.nature.com/articles/d41586-022-00103-9

https://docs.openalex.org/


來源:新智元