语音识别

中文版开源Llama 2同时有了语言、多模态大模型，完全可商用

可以说，AI 初创公司 LinkSoul.Al 的这些开源项目让海外开源大模型在国内的普及和推广速度与国际几乎保持了一致。 7 月 19 日，Meta 终于发布了免费可商用版本 L…

社会演员多
IT 2023年12月26日
3600
多组件卡片式问答引擎

#本篇文章联合同花顺人工智能领域开发者严同学创作 1.简介为了满足用户个性化需求以及精细化运营，越来越多的企业推出多组件式的卡片问答，这种回答方式不会千篇一律，能够更好地为客户提…

青葱年少
Python 2023年12月26日
4900
AI一点通： OpenAI whisper 在线怎么调用，怎么同时输出时间信息？

OpenAI 语音转文字 whisper API提供了两个端点，即转录和翻译，这基于我们最先进的开源大型v2 Whisper模型。它们可以用来：将音频转录成音频所在的语言。翻译…

乘风
IT 2023年12月23日
3900
【小沐学Python】Python实现语音识别（Whisper）

文章目录 1、简介 1.1 whisper简介 1.2 whisper模型 2、安装 2.1 whisper 2.2 pytorch 2.3 ffmpeg 3、测试 3.1 命令测…

青葱年少
IT 2023年12月22日
5300
【Video-LLaMA】增强LLM对视频内容的理解

Paper:《Video-LLaMA : An Instruction-tuned Audio-Visual Language Model for Video Understand…

青葱年少
IT 2023年12月21日
5300
.Net 使用OpenAI开源语音识别模型Whisper

.Net 使用OpenAI开源语音识别模型 Whisper 前言 Open AI在2022年9月21日开源了号称其英文语音辨识能力已达到人类水准的 Whisper 神经网络，且它亦…

青葱年少
IT 2023年12月21日
4700
Distil-Whisper：比Whisper快6倍，体积小50%的语音识别模型

内容来源：@xiaohuggg Distil-Whisper：比Whisper快6倍，体积小50%的语音识别模型该模型是由Hugging Face团队开发，它在Whisper核…

xiaoxingxing
IT 2023年12月20日
3000
OpenAI又一神器！Whisper 语音转文字手把手教程

语音转文字在许多不同领域都有着广泛的应用。以下是一些例子： 1.字幕制作：语音转文字可以帮助视频制作者快速制作字幕，这在影视行业和网络视频领域非常重要。通过使用语音转文字工具，字幕…

青葱年少
IT 2023年12月19日
3400
OpenAI Whisper 语音识别模型部署及接口封装【干货】

一、安装依赖 pip install -U openai-whisper 二、安装ffmpeg cd /opt # 下载 5.1 版本的 ffmpeg wget http://ww…

社会演员多
IT 2023年12月19日
6500
whisper语音识别部署及WER评价

1.whisper部署详细过程可以参照：🏠 创建项目文件夹 mkdir whisper cd whisper conda创建虚拟环境 conda create -n py310 …

xiaoxingxing
IT 2023年12月19日
3400