OpenAI开源！！Whisper语音识别实战！！【环境配置+代码实现】

青葱年少 • 2023年12月11日下午6:44 • IT • 阅读 42

****** 实现 .mp4转换为 .wav文件，识别后进行关键词匹配并输出关键词出现的次数

****** 完整代码实现请私信

环境配置

安装 ffmpeg

我的路径是G:\ffmpeg-master-latest-win64-gpl-shared\bin

找到自己的安装路径，进入到 bin 目录，复制这个路径

右击 —> 属性

高级系统设置

环境变量

找到 path，双击

新建 —> 把刚刚的路径粘贴进来，确定

在搜索框中输入 cmd ，打开终端，输入 ffmpeg -version，显示如下则表示安装成功

安装 opencc库

pip install opencc -i https://pypi.tuna.tsinghua.edu.cn/simple

安装 torch

pip3 install torch torchvision torchaudio -i https://pypi.tuna.tsinghua.edu.cn/simple

注：若运行时报关于 numpy 的错误，需要执行下面这个命令，更新 numpy 库

pip install numpy --upgrade

只展示核心，完整的请关注并私信

# 利用训练好的模型进行识别
result = whisper_model.transcribe('录音.wav')

文章出处登录后可见！

已经登录？立即刷新