模型部署 | AI技术聚合

导读费尽心血训练好的深度学习模型如何给别人展示？只在服务器上运行demo怎么吸引别人的目光？怎么才能让自己的成果落地？这篇文章带你进入模型部署的大门。 0 前言模型部署的步骤：…

技术文章 2024年2月19日

11400

一、背景介绍模型部署基本步骤分为模型选择、模型部署、运行，如果需要在特定的场景下定制化模型，则还需要进行数据集的选择、数据集格式转换、微调。根据上述的步骤本教程选取如下的开源模…

IT 2024年1月16日

10500

简介小伙伴们好，我是《小窗幽记机器学习》的小编：卖热干面的小女孩。紧接前文：万字长文细说ChatGPT的前世今生，后续会尝试以理论+实践的方式逐步对主流的各大LLM进行实测和汉化…

IT 2023年12月4日

9500

NVIDIA官方链接：https://developer.nvidia.com/cuda-gpus 搬运官网图表如下： Jetson Products GPU Compute Ca…

Python 2023年11月13日

12500

安装目录一、cuda安装 1.1、cuda版本选择 1.2、下载安装二、cudnn安装三、pytorch安装四、tensorRT8.X安装写在前面博主这里装的是cuda…

Python 2023年9月6日

18600

文章目录 1.TensorRT的安装 1.1 cuda/cudnn以及虚拟环境的创建 1.2 根据cuda版本安装相对应版本的tensorRT 2. TensorRT的使用 2.1…

Python 2023年8月6日

14500

技术文章

目录模型支持量化onnx原生模型：quantize_onnx_model 输入输出执行流程 ONNX格式解析后记模型支持 openppl支持了三种模型：onnx、caff…

2023年3月1日

31800

技术文章

目录前面四篇博客其实就讲了下面两行代码： ppq_ir = load_onnx_graph(onnx_import_file=onnx_import_file) ppq_ir =…

2023年2月25日

39400

技术文章

目录前言上一篇博客讲了计算图的加载和预处理，真是费了不少劲啊…… 这一篇博客和大家一起学习PPQ精髓之一：计算图的分割与调度。第一讲就说过PPQ把计算图分成了三类：可量化、不可…

2023年2月23日

35700