定义数据学科中的角色分类
他们做什么和他们的主要职责
我们生成的数据量呈指数增长,这为我们打开了许多机会之门。 “数据是新的石油,”你经常在现代商业活动中听到,而企业一直在采取行动。从那以后,几个工作角色兴起,推动了各个行业的数据革命。
对许多人来说,数据学科的头衔并不像你想象的那么重要。拥有相同头衔但在不同公司工作的人的日常工作流程可能会有很大差异——不过我不会完全忽视他们。慢慢但肯定地,我们开始认识到数据领域不存在独角兽,没有一个人可以尽一切努力在组织中有效地使用数据。
因此,公司已将职责分解为更专业的角色。在您的职业生涯初期,了解每个角色的一般职责非常重要,因为它将让您深入了解您必须掌握的必要工具和技能才能适合某个角色。
话虽如此,让我们来看看涉及的一些主要角色:
Data Analyst
数据分析的最终目标是提出业务问题的解决方案:他们通过发现可用于制定战略决策的数据模式来寻求提高组织的效率和绩效。因此,数据分析师使用数据来讲述可以帮助企业根据数据做出更明智决策的叙述。
数据分析师还需要在各种媒体(包括视觉、书面和口头)上具有出色的沟通技巧,因为有必要报告他们的结论。
Key responsibilities
- 与其他团队成员合作以改进数据收集过程和质量。
- 创建仪表板和报告。
- 对可以改进以提高组织或项目效率的领域进行数据分析和报告结论。
- 构建和维护自动化数据流程。
- 生成和跟踪业务 KPI。
- 开展数据审计。
Data Scientist
数据科学的最终目标是从数据中产生业务洞察力:当前数据用于发现机会。因此,数据科学家应该对企业面临的挑战有很好的理解,并能够提供基于数据驱动方法的解决方案。
由于他们的跨学科专业知识,他们很可能使用来自机器学习、统计学和数据挖掘。
Key responsibilities
- 与主题专家 (SME) 密切合作,确定问题并使用数据提出解决方案。
- 利用机器学习工具和各种统计技术来解决问题。
- Data cleaning.
- 源数据解决业务问题。
- 跨多个团队的协作,例如业务团队、工程团队和产品团队。
学习资源:DataCamp 上具有 Python 或 R 职业轨迹的数据科学家是一个很好的起点。[0][1]
Data Engineer
数据工程师构建数据管道来准备和转换原始数据和非结构化数据。管道通常包括数据的收集(可能来自各种来源)、处理和存储。他们的大部分时间都花在确保这些管道足够健壮、可靠且值得信赖以进行交付。
数据工程的最终目标是使数据可访问。换句话说,他们获得了使数据科学和机器学习成为可能的商品:有些人甚至会争辩说他们是数据团队中最重要的参与者。
Key responsibilities
- 设计、开发和维护数据系统和管道。
- Data acquisition.
- 分析和组织原始数据。
- 提高数据的可靠性和质量。
学习资源:DataCamp 上的 Python 数据工程职业轨道是一个很好的起点。您可能还想通过 Coursera 上的 IBM 数据工程师专业证书来扩展您的学习。[0][1]
Data Architect
“数据架构师设计和构建数据模型,以满足首席数据架构师定义的业务战略数据需求。在此级别,您将:按照数据政策对数据的升级、管理、停用和存档进行设计、支持和指导。” [来源:GOV.UK]。[0]
- 识别数据源(内部和外部)并制定数据管理计划
- 制定和实施整体组织数据战略。
- 与跨职能团队和利益相关者合作,以使数据系统顺利运行。
- 管理端到端的数据架构。
- 审核数据管理系统并在必要时对其进行改进。
Machine Learning Engineer
机器学习工程的最终目标是将数据转换为产品。该角色源于需要弥合数据科学家的工作(即分析和建模)与软件产品世界(即强大的系统工程)之间的差距。
因此,机器学习工程通常被认为是软件工程的一个子领域:除了机器学习需求之外,机器学习工程师和软件工程师的生活方式非常相似——这意味着他们应该是熟悉 IDE 等工具的熟练程序员、GitHub 和 Docker。
Key responsibilities
- 设计和构建机器学习系统。
- 构建自动化管道以部署机器学习模型。
- 适当地测试机器学习系统并监控其性能。
- 与数据工程师等人合作构建数据和模型管道。
学习资源:如何成为机器学习工程师可以作为学习轨迹参考。[0]
MLOps Engineer
MLOps 是关于将 DevOps 原则应用于机器学习系统的新热潮。因此,MLOps 工程师的重点通常更多地放在将机器学习模型部署到生产中,而不是构建它们。
它们支持机器学习工程师的方式类似于 DevOps 支持软件工程师的方式:工程师将创建软件,Ops 将提供基础设施并确保软件可靠运行。因此,我们可以说 MLOps 工程师负责构建机器学习模型时发生的所有活动。
Key responsibilities
- 构建和维护 MLOps 管道。
- 设计和实施云解决方案。
- 使用 Docker 和 Kubernetes 等工具确保机器学习应用程序具有可扩展性。
我们现在就到此为止。
注意:您会在不同的公司找到基于数据的其他几个角色(即数据讲故事者、机器学习研究员、机器学习科学家等)。我建议您使用诸如 Linkedin Jobs、Indeed、Glassdoor、DataCamp 等工作板进行研究。[0][1]
所提供的工作清单绝不是广泛的,只能作为指南。读者应该获取这些信息并继续研究每个角色所需的技术堆栈并建立一个投资组合。要记住的关键一点是,不同的公司以不同的方式组织他们的团队:不同的技术术语可以用来描述两个不同公司的相同工作。
Thanks for reading.
Connect with me:
LinkedIn
Twitter
Instagram[0][1][2]
如果您喜欢阅读这样的故事并希望支持我的写作,请考虑成为 Medium 会员。通过每月 5 美元的承诺,您可以无限制地访问 Medium 上的故事。如果您使用我的注册链接,我将收到一小笔佣金。[0][1]
已经是会员?订阅以在我发布时收到通知。[0]
文章出处登录后可见!