基于条件随机场模型的蒙古文地名自动识别研究
详细信息    查看全文 | 推荐本文 |
  • 英文篇名:Research on Mongolian Place Names Recognition Based on CRF
  • 作者:哈斯高娃 ; 王斯日古楞
  • 英文作者:Hasigaowa;WANG Siriguleng;College of Computer and Information Engineering,Inner Mongolia Normal University;
  • 关键词:条件随机场模型 ; 蒙古 ; 地名 ; 自动识别
  • 英文关键词:conditional random field model;;mongolian;;place names;;automatic identification
  • 中文刊名:NMSB
  • 英文刊名:Journal of Inner Mongolia Normal University(Natural Science Edition)
  • 机构:内蒙古师范大学计算机与信息工程学院;
  • 出版日期:2019-01-15
  • 出版单位:内蒙古师范大学学报(自然科学汉文版)
  • 年:2019
  • 期:v.48;No.195
  • 基金:国家自然科学基金资助项目(61762072);; 内蒙古自然科学基金资助项目(2016MS0623);; 内蒙古自治区蒙文信息化专项(MW-2017-MG YWXXH-02)
  • 语种:中文;
  • 页:NMSB201901013
  • 页数:4
  • CN:01
  • ISSN:15-1049/N
  • 分类号:85-88
摘要
根据蒙古文地名的特点,引入词性特征、字典特征、实体指示词特征以及外文地名用词特征,基于条件随机场模型对蒙古文地名自动识别问题进行研究.结果表明,该模型对蒙古文地名识别的准确率为95.45%,召回率为79.41%,F值为86.70%.
        According to the characteristics of Mongolian place names,the introduction of part-of-speech features,dictionary features,entity indicator features,and foreign language place names is used.Based on the conditional random field model,the automatic identification of Mongolian place names is studied.The results show that the accuracy of the model in identifying Mongolian place names is 95.45%,the recall rate is 79.41%,and the Fvalue is 86.70%.
引文
[1]宋成庆.统计自然语言处理[M].北京:清华大学出版社,2008.
    [2]闫萍.基于统计与规则相结合的命名实体识别研究[D].郑州:河南工业大学信息科学与工程学院,2012.
    [3]白慧琨,王斯日古楞.基于条件随机场的蒙古文人名识别[J].内蒙古师范大学学报(自然科学汉文版),2016,45(2):253-255.
    [4]那顺乌日图,雪艳,淑琴,等.蒙古文人名自动识别研究[M].北京:清华大学出版社,2003.
    [5]通拉嘎,赵小兵.基于蒙古文语料库的人名自动识别[D].北京:中央民族大学少数民族语言文学学院,2013.
    [6]哈斯巴特尔,刘杰.汉蒙对照内蒙古地名词典[M].呼和浩特:内蒙古人民出版社,2000.