按时间归档:2022年06月
-
数据科学行业值得关注的五个趋势
分析行业可能走向何方以及您可能如何为此做准备——著名曲棍球运动员经常引用一句话:“我滑到冰球将去的地方,而不是它曾经去过的地方。”这句话几乎适用于每个行业,数据科学也不例外。尽管概念数据科学并不完全是一项新研究,但应用…
-
在 Docker 上使用 TF Serving 托管模型
将 TensorFlow 模型部署为 REST 端点——训练机器学习 (ML) 模型只是 ML 生命周期中的一步。如果您无法从模型中获得响应,那么 ML 就没有任何意义。您必须能够托管经过训练的模型以进行推理。有多种托管/部署选项可用于……
-
假设检验的图解说明
一劳永逸地了解什么是假设检验。 Python 中的代码。 — 免责声明:嘿,为了说明清楚,这不是赞助帖子。我真的很喜欢这本书。假设检验 我最近读了这本很好的书《统计卡通导论》。它为基本的统计概念带来了有趣而流畅的介绍,所有这些都像漫画书一样呈现。要点之一……
-
4 个可以简化查询的 BigQuery SQL 快捷方式
检查你的数据库是否也有它们——当你开始学习 SQL 时,最常见的建议是练习基本语句,因为它们可以跨多个数据库工作。缺点是您可能永远不会发现可以简化查询的特定于数据库的语法,因为您永远不需要阅读文档。对我来说就是这种情况……
-
使用交互式混淆矩阵和折线图找到不平衡分类的最佳分类阈值
使用 binclass-tools 令人惊叹的 Python 包将二进制分类问题的分析提升到一个新的水平——即将训练分类模型的数据科学家经常会发现自己正在分析生成的混淆矩阵,以查看模型的性能是否令人满意。让我们仔细看看这是怎么回事。引入混淆矩阵术语“混淆”是指观察可以正确或……
-
在问题上投入更多计算
为什么它在长期或短期内都不是一个好的策略——背景 是的,这是查询编写者在面对他们编写了一个错误查询的事实时通常会采取的第一个出路。有时,他们有能力获得更多的计算来解决问题。大多数时候,事实并非如此。设计了…
-
大数据世界中的交易
为什么 ACID 支持对于模型预测的重现性至关重要? – 抽象的。具有 ACID 保证的事务曾经是数据库管理系统的支柱。然而,随着 Streaming 和 NoSQL 的到来,交易被认为过于严格,难以在大数据平台上实现。 …
-
如何使用 Python 轻松自动化电子邮件
使用 Python 自动处理无聊的电子邮件——你知道大多数办公室工作的共同点吗?在大多数情况下,您必须定期发送电子邮件。无论您是程序员、数据科学家还是工程师,您都可能必须每天阅读和回复电子邮件。此活动不添加任何…
-
使用贝叶斯优化调整深度神经网络
利用贝叶斯理论提高你的表现——在之前的一篇文章中,我们展示了一个关于使用 Tensorflow 和深度学习方法进行图像分类的案例研究。尽管案例研究很少,但它展示了机器学习项目的每个阶段:清理、预处理、模型构建、训练和评估。但是我们跳过了调优。在本文中,我们将深入研究……
-
时间序列的变量缩减技术
L1 惩罚和置换特征分数——在预测建模中,结果仅与添加到模型中的输入一样好。在时间序列中,选择模型输入的主要问题是如何最好地表示一个序列的历史来预测它的未来。我们可以将一个系列分解为其基本组成部分:趋势、季节性和……