3月17日,字節(jié)跳動宣布向北大教育基金會提供捐贈,全面支持“北京大學-字節(jié)跳動數(shù)字人文開放實驗室”的工作,研發(fā)古籍數(shù)字化平臺,利用智能技術(shù)加速中華古籍資源的數(shù)字化建設,向全社會提供公益化服務。
據(jù)了解,該實驗室將調(diào)動國內(nèi)外的相關(guān)力量,在三年內(nèi)完成一萬種精選古籍的智能化整理工作。提供開放、體驗良好的閱讀服務和基本文本庫,并借助知識圖譜等技術(shù)幫助學者高效檢索和利用古籍中的信息。
同時,項目也將推出結(jié)合OCR、句讀、實體識別和知識圖譜等技術(shù)構(gòu)建的一站式自動古籍智能化整理平臺,并對社會大眾免費開放,便于收藏機構(gòu)、研究者、相關(guān)專業(yè)的師生和廣大古籍愛好者自行完成古籍數(shù)字化工作,加快整個行業(yè)數(shù)字化古籍資料的效率。
據(jù)介紹,中國古籍一直面臨數(shù)字化程度低、以文本形式進行數(shù)字化的古籍數(shù)量少、難以檢索等問題。數(shù)據(jù)顯示,我國現(xiàn)存古籍有20萬種,據(jù)不完全統(tǒng)計,其中有數(shù)字化掃描影像的已經(jīng)有8萬種,而實現(xiàn)文本數(shù)字化的僅有3-4萬種左右。這對于古籍內(nèi)容檢索和開展研究造成了不便。
“北京大學-字節(jié)跳動數(shù)字人文開放實驗室”重視傳承中華傳統(tǒng)文化,希望將平臺建設成為開放、共享、可對古籍進行充分檢索利用的信息平臺,以應對這些古籍保護與利用中的挑戰(zhàn)。
“我們希望通過公益捐贈,支持北大的古籍數(shù)字化成果全面轉(zhuǎn)化為社會服務。我們也希望與北大的跨學科團隊在OCR、自然語言處理、知識圖譜等技術(shù)領(lǐng)域展開全面合作,充分利用人工智能技術(shù)加快古籍數(shù)字化整理、研究、與利用,讓更多的研究者、愛好者以更高效、便利的方式獲取古籍里蘊藏的豐富知識”,字節(jié)跳動 AI Lab總監(jiān)李航表示。
2021年6月17日,字節(jié)跳動聯(lián)合中國文物保護基金會,在國家圖書館成立古籍保護專項基金,初期啟動資金人民幣1000萬元,用于修復《永樂大典》“湖”字冊等105冊(件)珍貴古籍、培養(yǎng)100名修復人才等項目。據(jù)了解,這些修復的古籍也將逐步引入古籍數(shù)字化平臺。
“我們將發(fā)揮字節(jié)跳動在互聯(lián)網(wǎng)產(chǎn)品研發(fā)和設計上的優(yōu)勢,優(yōu)化并創(chuàng)新古籍數(shù)字化平臺的產(chǎn)品功能,為大家提供更好的古籍檢索和閱讀體驗?!北本┳止?jié)跳動企業(yè)社會責任部產(chǎn)品總經(jīng)理唐塏鑫說,“后續(xù)我們還會嘗試將古籍數(shù)字化平臺的內(nèi)容與今日頭條、頭條百科、抖音等產(chǎn)品相連接,讓優(yōu)質(zhì)的古籍內(nèi)容和傳統(tǒng)文化知識可以觸及到更多用戶?!?/p>
字節(jié)跳動公益還發(fā)起“尋找古籍守護人計劃”,邀請專家學者、文化名人、抖音創(chuàng)作者通過知識講解、說書、繪畫等形式傳播古籍內(nèi)容,普及古籍知識,傳播古典文化。
文/廣州日報·新花城記者卜松竹
圖/主辦方提供
廣州日報·新花城編輯:孫珺
關(guān)鍵詞: 三年內(nèi)完成一萬種古籍智能化整理 字節(jié)跳動攜手北大推動古