站内搜索 / download
港澳台民国史

「中央研究院數位人文研究平台」上線

发布时间:2018-11-17 21:30:00

      中央研究院數位文化中心根據人文研究的需求,發展協助學者提升研究質量的數位化工具與平台。期望結合研究者、研究資料與研究工具之綜效,擴大研究的規模及縮短研究的時間,以提升人文研究的質量。 數位人文研究平台提供一個完整的研究環境,讓研究者可以透過雲端服務取得研究中所需的資料與工具。研究者可上傳文本與權威詞,也可使用平台中其他開放的文本與權威詞來進行研究權威詞具有手動與自動標記文本的功能,並可以使用階層方式分類權威詞。標記文本完成後,可進行權威詞與N字詞詞頻統計、共現詞關聯分析,再以統計圖表、文字雲、社會網絡分析圖、地圖等資料視覺化方式呈現。此外,平台提供相似內容比對、正規表示式查詢、多詞間距查詢與統計篩選功能,讓研究者可以容易地進行考據。

資料彙整:彙整與介接中研院史語所漢籍的文本(約2.6億字)、日本京都大學的漢籍文本Kanripo (約13億字)、美國哈佛大學的中國哲學書電子化計劃Ctext (約51億字)與地名、朝代名、人名等開放權威檔,提供研究者基礎的研究素材。

共同編輯:提供多人可共同編輯文本、權威檔、標記內容及群組管理功能,讓研究者可依不同的研究主題,形成不同的研究社群。

內容搜尋:提供文本結構與內容瀏覽、布林邏輯查詢、多詞間距查詢與查詢結果統計篩選、相似文本比對功能,讓研究者可以快速找出關鍵詞的分布及過濾查詢結果。

資料分析:提供跨文本的權威詞、N字詞詞頻、詞頻變化量統計及共現詞關聯分析,讓研究者可以從大量資料中快速找資料中的脈絡關係。

視覺化:提供圓餅圖、折線圖、文字雲、社會網絡分析圖、地理資訊系統等工具,以圖形方式呈現文本分析之結果,讓研究者可以更直覺地俯視資料中隱含的現象。

此外,我們也持續發展數位人文研究的相關工具與技術,包含鏈結開放資料(Linked Open Data, LOD)、國際圖像互操作架構 (International Image Interoperability Framework, IIIF)、中文古籍圖像文字辨識技術 (Optical Character Recognition, OCR)、命名實體識別技術(Named Entity Recognition),待技術與工具發展成熟後,我們將開放工具與服務供研究者使用。

中央研究院數位人文研究平台> https://bit.ly/2D9ByrR


上一篇:《澳门理工学报(人文社会科学版)》2018年总目录

版权所有:南京大学中华民国史研究中心 苏ICP备09043283号

电话(传真):025-83594638 邮箱:lvjingnd@nju.edu.cn 地址:南京市汉口路22号逸夫管理科学楼

迈点科技技术支持