English  |  正體中文  |  简体中文  |  全文筆數/總筆數 : 80990/80990 (100%)
造訪人次 : 42686648      線上人數 : 1543
RC Version 7.0 © Powered By DSPACE, MIT. Enhanced by NTU Library IR team.
搜尋範圍 查詢小技巧:
  • 您可在西文檢索詞彙前後加上"雙引號",以獲取較精準的檢索結果
  • 若欲以作者姓名搜尋,建議至進階搜尋限定作者欄位,可獲得較完整資料
  • 進階搜尋


    請使用永久網址來引用或連結此文件: http://ir.lib.ncu.edu.tw/handle/987654321/85054


    題名: 以自動產生之標註資料進行明實錄人名命名實體鏈結;Establishing an Entity Linking Model for Person Names in Ming Shilu with Automatically Constructed Labeled Data
    作者: 吳承翰;Wu, Chang-Han
    貢獻者: 資訊工程學系在職專班
    關鍵詞: 命名實體鏈結;明實錄;中國歷代人物傳記資料庫;人名權威資料庫;自動產生訓練資料;BERT;Named Entity Linking;Ming Shilu;China Biographical Database Project;Ming Qing Biographical Database;Auto-generated Training Data;BERT model
    日期: 2021-01-26
    上傳時間: 2021-03-18 17:30:27 (UTC+8)
    出版者: 國立中央大學
    摘要: 命名實體鏈結 (NEL, Named Entity Linking) 是自然語言處理 (NLP,
    Natural Language Processing) 的一項研究,在 NLP 中的研究中和應用
    有著重要的作用,是不可或缺的一環,若能有效地提升 NEL 的準確性
    的話就能更好的為開發高性能的 NLP 系統奠定基礎。
    NEL 的主要挑戰是缺少帶標註的文本,在漢籍文本上尤為困難,
    原因是因為古代人名時常出現重複的人名,使得註釋者除了必須會閱
    讀漢籍文本之外也必須將每個候選人名的個人資料與文本的上下文做
    比較,而使得研究人物的關係和社會網路更為困難,而本研究為了解
    決此問題本篇提出了一套架構,除了上述問題之外也解決標註資料過
    少的問題,該系統利用中國歷代人物傳記資料庫與中研院的人名權威
    資料庫裡人名的履歷、時間、關係人等欄位自行產生訓練資料後再使
    用 BERT 模型達成古人名的實體消歧與鏈結。
    本研究以《明實錄》做為實驗文本,《明實錄》是中國明代官修的編
    年體史書,該書中記錄了從明太祖朱元璋到明熹宗朱由校共十五代皇
    帝,約兩百五十年的大量歷史文本,其中包含十三部,三千零五十五
    卷,共計一千七百多萬字,而其中文本包含朝廷各院所呈繳之章奏、
    批件等,並以各省官員收集的先朝紀錄作補充,逐年紀錄各個皇帝詔
    赦、律令等,並含括了政治、經濟、文化、祭祀等大事而成。目前本
    研究總共成功標註 8,787 個人名、257,302 個標籤,準確率 92.08%。;NEL plays an important role both in the study and application of NLP. If
    the accuracy of NEL is effectively improved, the foundation of high-performance
    NLP development can be laid.
    The main challenge of NEL is the lack of annotated texts, especially in
    studying Classical Chinese, because ancient names often appear repeatedly,
    which makes it difficult to study the historical figures relationships and their
    social networks. Our system used the China Biographical Database Project
    (CBDB) and Ming Qing Biographical Database to generate training data and
    then uses BERT model to eliminate the physical disambiguation of the names.
    This study took the Ming Shilu as the experiment text. The Ming Shilu is
    an official chronological history book of the Ming Dynasty in China, chroni-
    cling 15 generations emperors, from Zhu Yuan-Zhang to Zhu You-Jiao, cov-
    ering about 250 years. There is over 17 million characters including 30,055
    volumes and 13 parts in the Ming Shilu. The text records the imperial pardons
    and laws of each emperor as well as political, economic, cultural, and ritual
    events year by year, including the imperial decrees and approvals submitted
    by the imperial ministries, and the records of previous dynasties collected by
    the provincial officials.
    8,787 names and 257,302 tags were successfully tagged in this study, with
    92.08% accuracy.
    顯示於類別:[資訊工程學系碩士在職專班 ] 博碩士論文

    文件中的檔案:

    檔案 描述 大小格式瀏覽次數
    index.html0KbHTML177檢視/開啟


    在NCUIR中所有的資料項目都受到原著作權保護.

    社群 sharing

    ::: Copyright National Central University. | 國立中央大學圖書館版權所有 | 收藏本站 | 設為首頁 | 最佳瀏覽畫面: 1024*768 | 建站日期:8-24-2009 :::
    DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library IR team Copyright ©   - 隱私權政策聲明