[NER]邮寄地址识别(BiLSTM+CRF)

**邮寄地址识别任务是一个命名实体识别任务,本文使用BiLSTM+CRF实现该任务的开发,供你参考,详情请点击:https://github.com/niubiqigai/address_ner(欢迎fork,欢迎star,拒绝白嫖)

BiLSTM+CRF简单介绍

LSTM:实际上是一种循环神经网络(RNN),但其内部每一个细胞单元,都具有门结构,门结构包括遗忘门、输入门和输出门。通过门结构,可以记忆一段序列的前后关系,使整个模型具有“记忆”效果。也就是“长短期记忆网络”(Long Short Term Memory networks)的由来。BiLSTM则是对文本双向都进行了LSTM处理,序列进行拼接。细胞单元结构图如下:
BiLSTM

CRF:条件随机场(Conditional Random Fields),对于序列标注问题,每个标签与其前、后标签具有关联关系,比如“小红要吃西瓜”,“吃”前面应该是人名“小红”,后面应该是食品“西瓜”,而不会出现“西瓜要吃小红”这种词性前后顺序错误的文本。CRF正是基于概率模型,限定文本中字词的前后关系,使序列预测更准确。

该项目确定的实体

1、省份
2、城市
3、区县
4、具体地址
5、收件人
6、收件人联系电话

项目亮点

1、对省、市、区全称和简称做了较完整的收集,构建的训练集数据基本覆盖全国省市区。
2、对全国采用姓氏做了较完整的收集,构建的训练集数据基本覆盖全国姓氏。
3、对城市和区县的邮政编码进行整理,返回报文中包含邮政编码。

影响

http://127.0.0.1:5033/base/address/predict?text=北京市大兴区312国道西侧 修昊14975916791
效果图

版权声明:本文为博主niubiqigai原创文章,版权归属原作者,如果侵权,请联系我们删除!

原文链接:https://blog.csdn.net/niubiqigai/article/details/123172183

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
社会演员多的头像社会演员多普通用户
上一篇 2022年2月28日
下一篇 2022年2月28日

相关推荐