Data Science

  • 你还在用肘法吗?

    Elbow 方法是查找 k-means 聚类数的最流行方法。但还有更好的选择——我请 ChatGPT 就如何为 k-means 选择正确数量的集群提供建议。这是答案:

    2023年2月5日
    1660
  • 这 7 个编程习惯让你成为一个效率低下的数据科学家

    改正这些习惯可以让你成为更高效的数据科学家——我敢肯定,在我们通向数据科学的集体旅程中,我们都在某个时候至少犯过这些坏习惯中的一个或另一个。无论我们是在刚开始学习时做这些事情,还是因为我们相当擅长我们所做的事情而在以后做这些事情……

    2023年2月5日
    1980
  • 回归基础,DOS 部分:线性回归、成本函数和梯度下降

    欢迎来到我们回归基础系列的第二部分。在第一部分中,我们介绍了如何使用线性回归和成本函数为我们的房价数据找到最佳拟合线。然而,我们也看到测试多个截距值可能是乏味且低效的。在…

    2023年2月5日
    1200
  • Elliot 激活函数:它是什么并且有效吗?

    什么是 Elliot 激活函数?它是否可以替代神经网络中使用的其他激活函数? — 简介 您是否正在创建一个新的机器学习模型并且不确定您应该使用什么激活函数?但是等等,什么是激活函数?激活函数允许机器学习模型理解和解决非线性问题。在神经网络中使用激活函数特别有助于……

    2023年2月5日
    1760
  • 用于训练、验证和评估机器翻译的数据集

    选择、检查和拆分——对于大多数自然语言处理 (NLP) 任务,一个重要的步骤是选择数据集来训练、验证和评估系统。机器翻译也不例外,但具有任务的多语言性所固有的一些特殊性。在这篇文章中,我解释了如何选择、检查和拆分……

    2023年2月5日
    1140
  • 数据科学家必须重新审视他们的工具集:让我解释一下

    无论您是数据科学家还是想成为一名数据科学家,您都必须重新审视您的工具集——您是一名正在非软件企业寻找工作的数据科学家吗?您是否需要在短时间内从大型数据集中提取洞察力?你想评估你的想法是否可以被人工智能解决吗? …

    2022年6月14日
    2380
  • 数据科学的特征选择:简单的方法

    通过摆脱与我们的数据集无关的特征,我们可以创建更好的预测模型。 — 每个数据科学家都面临或将遇到这个问题;一个巨大的数据集,包含如此多的特征,他们甚至不知道从哪里开始。虽然有许多高级方法可用于为数据集选择最佳特征集合,但有时简单的方法……

    2022年6月14日
    1960
  • 如何为数据科学家编写好的代码文档

    有关确保每个人都理解您编写的代码所需的最佳实践的速成课程。 — 编写良好代码文档的数据科学家很像工程师,确保支撑桥梁的支柱能够承受桥梁本身和使用它的乘客的重量。代码文档不仅提供了代码功能的概念,而且还提供了…

    技术文章 2022年6月14日
    2210
  • 初学者使用 PySpark 处理数据

    从 Pandas 用户的角度来看 PySpark 入门 – Pandas 库是数据科学家武器库的主要内容,由于其功能和易用性,许多人开始依赖该模块进行数据处理。不幸的是,Pandas 在处理大数据方面存在不足,随着大数据变得越来越普遍,这带来了一个问题。 …

    2022年6月14日
    2060
  • 计算机视觉领域的发展

    计算机视觉领域的概述以及技术基础设施的进步如何支持其增长和可扩展性 – 从事计算机视觉 (CV) 工作的人工智能 (AI) 从业者和开发人员实施和集成解决方案,以解决涉及计算机和计算机系统中的视觉问题。图像分类、人脸检测、姿态估计和光流是 CV 任务的典型示例。

    2022年6月14日
    7620