作者:禅与计算机程序设计艺术
1.背景介绍
如今人工智能技术已经取得了惊人的成就,但随之而来的一个问题就是如何将其应用到实际生产中去。如何让机器学习的模型在部署时能够顺利运行,不出现各种各样的问题,模型能够提供出符合用户需求的预测结果?这一切都需要模型部署与服务化相关技术的配合才能实现。
模型部署主要涉及以下四个方面:
- 模型训练、选择与优化:这里包括如何选择正确的模型进行训练,模型的超参数设置是否合适等;
- 模型存储、版本管理:模型的存储需要考虑模型大小、可迁移性等因素;
- 服务配置与管理:服务配置指的是将模型部署到服务器上并进行相应的环境配置;服务管理则是在线服务常用的功能,比如动态扩容、灰度发布等;
- 性能调优:如何提升模型的性能,减少响应时间或者降低资源消耗?
2.核心概念与联系
2.1 概念
2.1.1 模型部署与服务化概述
模型部署与服务化(Model Deployment and Serving)是机器学习系统的两个关键技术。模型部署是指将机器学习模型部署到服务器或云端,使得模型能够被客户端调用执行预测任务。模型服务化是指将模型部署后,通过RESTful API接口的方式对外提供服务,供其他服务或者客户端调用。服务化方式能够更好的保证模型的稳定性、可用性和安全性。
常用模型部署工具:TensorFlow Serving、Apache MXNet Model Server、PaddleServing、TorchServe、ONNX Runtime等。
常用服务化框架
文章出处登录后可见!
已经登录?立即刷新