按时间归档:2022年06月
-
计算机视觉领域的发展
计算机视觉领域的概述以及技术基础设施的进步如何支持其增长和可扩展性 – 从事计算机视觉 (CV) 工作的人工智能 (AI) 从业者和开发人员实施和集成解决方案,以解决涉及计算机和计算机系统中的视觉问题。图像分类、人脸检测、姿态估计和光流是 CV 任务的典型示例。
-
如何处理数据科学中的缺失值
处理 DS 项目中缺失值的三种实用方法 — 在处理真实数据时,您可能经常会在数据框中发现缺失值。发生这种情况可能有几个原因,例如:某些测量可能会丢失缺少信息记录错误所以问题是:如何处理丢失的数据?我们可以接受 0 作为值吗?
-
在 SQL 中查找唯一记录的 3 种终极方法
停止使用 DISTINCT!开始使用这些快速替代方案以避免混淆! — 无需使用 DISTINCT 关键字即可获得唯一记录! 🏆 在您的数据分析项目中,每当您需要从数据库中提取唯一记录时,一个简单的答案就是使用 DISTINCT!毫无疑问,DISTINCT 是为返回唯一的行而设计的,它的工作做得很好。但是,它不…
-
面向 NLP 初学者的深度 spaCy 教程
学习自然语言处理的 Scikit-learn — 简介 不,我们今天不会构建具有数十亿参数的语言模型。我们将从小处着手,学习使用 spaCy 的 NLP 基础知识。我们将仔细研究该库的工作原理以及如何使用它轻松解决初学者/中级 NLP 问题。帖子是……
-
剪辑和粘贴:使用 AI 从文本提示创建照片拼贴
如何使用 ML 模型从照片中提取对象并重新排列它们以创建现代艺术 – 在我之前的许多帖子中,我展示了如何使用 AI 模型从文本提示中创建新的艺术作品。 …
-
如何在 Apache Airflow 中设计更好的 DAG
设计工作流时需要了解的两个最重要的属性——上周,我们学习了如何快速启动 Apache Airflow 的开发环境。这太棒了!然而,我们还没有学会如何设计一个高效的工作流程。仅仅拥有一个触手可及的好工具并不能单独达成交易——不幸的是。尽管 Apache Airflow 确实…
-
数据漂移可解释性:使用 NannyML 进行可解释的移位检测
提醒有意义的多变量漂移并确保数据质量——模型监控正在成为机器学习的热门趋势。随着有关 MLOps 活动的新月炒作,我们记录了有关该主题的工具和研究的兴起。其中最有趣的肯定是 NannyML 开发的基于置信度的性能估计 (CBPE) 算法。他们实施了……
-
在 Kaggle 比赛中崛起的 3 大非机器学习技能
数据、创造力和策略会让你登上排行榜——这听起来可能违反直觉。但是,在 Kaggle 等机器学习竞赛中,让你比其他人更有优势的关键技能可能不是机器学习。你对机器学习算法的了解只是你在 Kaggle 中需要的基本技能。应用不同的算法、集成和超参数优化是……
-
神经网络的实际工作原理——Python 实现第 2 部分(简化)
在本文中,我们继续揭穿神经网络是一个我们不太了解它是如何工作的黑匣子的理论。我们的目标是以易于理解的方式实现神经网络。如果有些概念不能立即理解,请查看之前的文章……
-
一致的半监督、可解释的医学成像多任务处理
MultiMix:从医学图像中进行少量监督、极端多任务学习 — 在本文中,我将讨论一种新的半监督、多任务医学成像方法 MultiMix,作者是 Ayaan Haque(我)、Abdullah-Al-Zubaer Imran、Adam Wang和德米特里·特佐普洛斯。我们的论文被 ISBI 2021 的全文接收,并在 4 月的会议上发表。我们论文的扩展…