标注工具—labelme, label-studio


最近在学习使用标注工具,图像领域比较知名的标注工具如labelme,最近又发现了一款十分好用的集成标注工具label-studio,功能十分强大。故做下记录,以便于需要时使用。

实验环境:
Ubuntu 20.04, 下面的配置都是基于anaconda进行的。

一、Labelme

安装

安装非常简单,

# conda create --name labelme python=3.8
# conda activate labelme
# pip install pyqt5
# pip install labelme

使用

进入labelme环境以后,运行# labelme 命令,可以看到打开的labelme界面,如下,比较简陋,
在这里插入图片描述如上图所示,加载一张图片以后可以通过Create Polygons来标注目标的边界框,然后通过Edit Polygons进行微调, 标注完成后可以在右边看到label_list, polygon list,.

导出

点击左侧的save,标注信息保存为json文件,打开后如下:
在这里插入图片描述可以看到标注信息实际上就是边界框(4个points)和label。

二、label-studio

简介

Label-studio是一款功能十分强大的标注工具IDE, 具有如下特点:
可配置: 使用jsx tags配置,自定义配置标注页面,所以可标注格式很多,样式也可以自定义
协作标注: 由两个或更多人label同一任务,然后比较结果,还支持用户名密码简单的认证。 支持按预测的模型预测的probability的大小顺序标注,默认按导入数据的索引顺序标注。
多种数据类型: 您定义自己的具有不同的label类型, Images, Audios, Texts, HTMLs,已有大量模板,直接使用接口
支持导入格式: JSON, CSV, TSV, RAR and ZIP archives,支持API导入数据。
NPM嵌入: 前端是NPM包, NPM package. 您可以将其包含在您的项目中 .机器学习: 机器学习的集成支持。 可视化并比较来自不同模型的预测。
pre-labeling功能很好,可以实现用训练的模型预标注数据,那么结果人工标注前就比较方便,而且还知道模型预测的怎么样支持docker容器部署方便的API接口

安装

# conda create --name label-studio python=3.8
# conda activate label-studio
#  pip install label-studio

注:因为网络原因我湿了好多次才安装成功。

使用

label-studio环境下,执行 # label-studio即可打开界面,如下图所示,

在这里插入图片描述点击右边的“Create” 来创建Projects,Project的创建分为3步:
(1) 设置项目名称和描述信息
在这里插入图片描述

(2)导入数据,可以通过URL导入或者本地文件夹,支持 文本,视频,音频数据,各种格式都支持哈。
在这里插入图片描述

(3)指定具体的标注任务,指定以后进一步设置相关所需的信息
在这里插入图片描述

例子

我创建了一个NLP -text classification的Project, 在labeling setup这一步我设置了共三个类别:Command, Non-Command, Neutral。创建完成以后如下图所示:
在这里插入图片描述由于我导入的是一个文本数据,每一行对应一个样本,也就是上图中的一个个task, 接下来要对每个task设置标记。
随便选择一个task右击打开如下图,直接从上一步设置label space中选中一个标记即可,记得点击Submit进行提交, 提交之后可以看到左边的对应Task的Total anacontation per task状态由0变为1。
当然也可以点击上边的label all tasks, 然后连续地进行宁标注任务。
在这里插入图片描述
所有tasks标注完成以后, 就可以导出了,直接点击右上角的Export导出为指定格式的文件即可。

当然也可以使用模型进行辅助标记, 这个对于图像标注任务非常有帮助,能够大幅提升标注的效率, 后边有时间再细说。

总结

Label-studio功能非强大,并且本身也在不断升级,推荐使用。

文章出处登录后可见!

已经登录?立即刷新

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
乘风的头像乘风管理团队
上一篇 2023年2月25日 下午8:58
下一篇 2023年2月25日 下午9:00

相关推荐