NLP基础:标注器Label Studio的入门使用

目录


简介: 

Label Studio是一个开源的数据标注工具,它可以用于各种机器学习和深度学习项目。它的主要目的是帮助数据科学家和机器学习工程师快速、高效地标注数据,以构建和训练准确的机器学习模型。Label Studio支持多种数据类型的标注,如图像、文本、音频和视频等,还提供了许多功能和工具,如标注管理、批注、团队协作、数据可视化和自动化等。Label Studio是由心智大数据(MindsDB)开发和维护的开源软件,它在GitHub上提供了完整的文档和代码。

一、环境准备

我用的是pycharm,在anaconda中配置如下环境并进入该环境:

  • Python 3.8+
  • label-studio == 1.7.1
  • paddleocr >= 2.6.0.1

配置完后在控制台输入

label-studio start

然后就会自动登录网页,一般是http://localhost:8080/。新用户注册一下

二、操作 

进入后点击创建项目

起好名,选择natural language processing,再选择named entity recognition

 

 左边这个框可以编辑自己要标注的关键词

 点击import导入文本文件,我随便现弄了一个

 标注词按自己要求来

 导入后点击上面进行标注任务

一个一个标即可。 

 最后标完导出即可,可以json、csv等等

文章来源:

1.基于Label studio的训练数据标注指南:信息抽取(实体关系抽取)、文本分类等 – 腾讯云开发者社区-腾讯云

文章出处登录后可见!

已经登录?立即刷新

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
青葱年少的头像青葱年少普通用户
上一篇 2023年6月25日
下一篇 2023年6月25日

相关推荐