计算机视觉中用于图像增强的顶级 Python 库

原文标题Top Python libraries for Image Augmentation in Computer Vision

计算机视觉中用于图像增强的顶级 Python 库

为您的下一个计算机视觉项目提供最好的增强库(以及示例代码)

计算机视觉等深度学习任务高度依赖大量图像进行训练。

虽然像迁移学习这样的技术已经减少了所需的数据量,但要获得良好的模型性能,仍然需要具有足够质量、数量和多样性的数据集。[0]

在本文中,我们将介绍最流行和最强大的 Python 库,它们可以显着提升您的图像数据集。

Contents

(1) About Image Augmentation
(2) 图像增强包
(3) Sample Implementation Codes
(4) Wrapping it up[0][1][2][3]

About Image Augmentation

图像增强的目标是通过生成原始图像的修改副本来人为地增加训练图像数据集的大小。

一些标准的图像增强技术包括:

  • 将图像顺时针或逆时针旋转给定角度
  • 垂直或水平翻转图像
  • 通过增加或减少图像亮度来调整亮度
  • 通过应用模糊效果添加噪声(例如,高斯模糊)
  • 向内或向外缩放图像以获得不同程度的缩放

根据用例,可以使用更复杂的技术,例如颜色量化、直方图均衡和粗略丢失。

图像增强包

了解了图像增强背后的动机后,让我们看看允许我们将这些概念付诸实践的软件包。

以下包是根据 GitHub repo star 数量的增加排列的 ★。请注意,这些星级仅反映受欢迎程度,不应被视为质量的精确衡量标准。

在我看来,这些库都非常有能力执行增强来满足我们的大部分需求。话虽如此,让我们开始吧。

(6) scikit-image[0]

★ 4.4K GitHub stars[0]

scikit-image 是一个开源库,包含一系列易于使用的图像处理算法。它建立在 scipy.ndimage 之上,旨在成为科学图像分析和图像处理的参考库。[0][1]

高质量的代码由活跃的志愿者社区编写和同行评审。[0]

(5) Augmentor[0]

★ 4.5K GitHub stars[0]

Augmentor 是 Python 中用于机器学习的图像增强库。它的目标是成为一个独立的库,独立于平台和框架,允许对增强进行方便和细粒度的控制。[0]

它最终允许用户为其图像数据集执行最相关和最真实的增强技术。

(4) Albumentations[0]

★ 8.4K GitHub stars[0]

Albumentations 是一个 Python 库,用于快速灵活的图像增强。它有效地为不同的计算机视觉任务实现各种图像转换,包括对象分类和检测。[0]

它还能够与流行的深度学习框架集成,例如 PyTorch 和 Keras。[0][1]

(3) Torchvision[0]

★ 9.5K GitHub stars[0]

Torchvision 包是 PyTorch 项目的一部分,这是一个流行的开源 Python 机器学习框架。它由许多样本数据集、模型架构和用于计算机视觉的典型图像转换组成。[0]

该软件包由 Facebook AI 团队开发,有意与 PyTorch 分开,以保持精简和轻量级,同时仍可与 PyTorch 无缝协作。

(2) imgaug[0]

★ 11.5K GitHub stars[0]

imgaug 是一个用于机器学习实验中图像增强的库。它支持各种增强技术,允许用户轻松地以随机顺序或在多个 CPU 内核上组合和执行它们。[0]

它有一个简单而强大的随机界面,可以增强图像、地标、边界框、热图和分割图。

(1) OpenCV[0]

★ 55.8K GitHub stars[0]

OpenCV(开源计算机视觉)可能是最著名的计算机视觉任务开源库。[0]

它专注于图像处理、视频捕获和分析(包括人脸检测和对象检测等功能),还有助于为计算机视觉应用程序提供通用基础架构。

Sample Implementation Codes

要访问上面显示的库的示例 Python 入门代码,请随时查看此 GitHub 存储库中的 Jupyter 笔记本。[0]

Wrapping it up

图像增强是一种丰富训练数据集以提高计算机视觉算法性能的工具技术。列出的 Python 工具使在实践中实现这些增强变得容易。

以下是所涵盖的库的回顾:

▶ scikit-image
▶ Augmentor
▶ Albumentations
▶ Torchvision
▶ imgaug
▶ OpenCV

我的偏好曾经是 Torchvision(因为我倾向于在我的项目中使用 PyTorch),但我已经切换到 imgaug,因为可用的增强选项数量更多。

在所有增强过程中,确保增强图像看起来逼真并反映实际上下文至关重要。

否则,看起来不真实的图像将使您的深度学习模型学习看起来与实际不同的事物,从而对模型准确性产生负面影响。

Before you go

我欢迎您加入我的数据科学学习之旅!关注此 Medium 页面以了解更多数据科学内容,或在 LinkedIn 上与我联系。玩得开心增强您的图像![0][1]

文章出处登录后可见!

已经登录?立即刷新

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
扎眼的阳光的头像扎眼的阳光普通用户
上一篇 2022年4月28日
下一篇 2022年4月28日

相关推荐

此站出售,如需请站内私信或者邮箱!