AI架构师必知必会系列：模型部署与服务化

社会演员多 • 2023年11月28日下午1:25 • Python • 阅读 47

作者：禅与计算机程序设计艺术

1.背景介绍

如今人工智能技术已经取得了惊人的成就，但随之而来的一个问题就是如何将其应用到实际生产中去。如何让机器学习的模型在部署时能够顺利运行，不出现各种各样的问题，模型能够提供出符合用户需求的预测结果？这一切都需要模型部署与服务化相关技术的配合才能实现。

模型部署主要涉及以下四个方面：

模型训练、选择与优化：这里包括如何选择正确的模型进行训练，模型的超参数设置是否合适等；
模型存储、版本管理：模型的存储需要考虑模型大小、可迁移性等因素；
服务配置与管理：服务配置指的是将模型部署到服务器上并进行相应的环境配置；服务管理则是在线服务常用的功能，比如动态扩容、灰度发布等；
性能调优：如何提升模型的性能，减少响应时间或者降低资源消耗？

2.核心概念与联系

2.1 概念

2.1.1 模型部署与服务化概述

模型部署与服务化（Model Deployment and Serving）是机器学习系统的两个关键技术。模型部署是指将机器学习模型部署到服务器或云端，使得模型能够被客户端调用执行预测任务。模型服务化是指将模型部署后，通过RESTful API接口的方式对外提供服务，供其他服务或者客户端调用。服务化方式能够更好的保证模型的稳定性、可用性和安全性。

常用模型部署工具：TensorFlow Serving、Apache MXNet Model Server、PaddleServing、TorchServe、ONNX Runtime等。

常用服务化框架

文章出处登录后可见！

已经登录？立即刷新

AI架构师必知必会系列：模型部署与服务化

1.背景介绍

2.核心概念与联系

2.1 概念

2.1.1 模型部署与服务化概述

相关推荐