jionlp:一款解析地址信息的神奇 Python 库

在日常数据处理过程中,有时会得到完整的地址信息。如果需要从地址信息中解析出相应的各级行政单位名称,方法有很多种,今天要介绍的方法只需要一行代码。可以快速实施。

首先我们需要安装jionlp这个非常好用的文本预处理工具包,建议使用国内镜像安装:

pip install jionlp -i https://pypi.douban.com/simple/

安装完成后,只需要使用其parse_location()接口即可进行地址信息的解析,且具有多种不同的功能:

  • 基本省市信息抽取
    图片
  • 街道、乡、村或居委会信息提取

通过设置参数town_village=True,还可以额外尝试提取出街镇乡、村或居委会信息等级别的信息字段:

图片

  • 自动完成省市信息

若地址信息中缺失省市信息也无妨,在不存在歧义的情况下,parse_location()会自动关联并补全相关信息:

图片

除此之外,parse_location()还具有旧地名修正为新地名、自定义行政区划词典等功能,你可以在其官方文档https://github.com/dongrixinyu/JioNLP/wiki/Gadget-说明文档#地址解析中了解更多。

推荐文章

  • 李宏毅《机器学习》国语课程(2022)来了 [0]
  • 有人做了吴恩达老师的机器学习和深度学习中文版[0]
  • 上瘾了,最近给公司做了个大可视屏(附源码)[0]
  • 如此优雅,4款 Python 自动数据分析神器真香啊 [0]
  • 梳理半月有余,精心准备了17张知识思维导图,这次要讲清统计学 [0]
  • 香的很,整理了20份可视化大屏模板 [0]

文章出处登录后可见!

已经登录?立即刷新

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
青葱年少的头像青葱年少普通用户
上一篇 2022年5月8日
下一篇 2022年5月8日

相关推荐