语音识别
-
《语音识别模式、算法设计与实践》——第二章 必知必会的数学基础知识——向量与矩阵
随着机器学习算法的发展,语音识别中几乎所有的模型和算法都是建立在数学的基础之上,数学最大的作用是将具体问题抽象成公式或数字化表示,便于计算机实现自动化运算。 …
-
【AIGC】深入探索AIGC技术在文本生成与音频生成领域的应用
🚀文章标题 🚀AIGC之文本生成 🚀应用型文本生成 🚀创作型文本生成 🚀文本辅助生成 🚀重点关注场景 🚀音频及文字—音频生成 🚀TTS(Text-to-speech)场景 🚀乐曲/…
-
AIGC的崛起:定义未来内容创作的新纪元
🌟文章目录 🌟AIGC简介 🌟 AIGC的相关技术与特点 🌟AIGC有哪些应用场景? 🌟AIGC对其他行业影响 🌟面临的挑战与问题 🌟AIGC未来发展 🌟AIGC十大热门网站推荐:…
-
[语音识别]开源语音识别faster-whisper模型下载地址
官方源码: https://github.com/SYSTRAN/faster-whisper 模型下载地址: large-v3模型:https://huggingface.co/…
-
【MacOS】openai 语音识别模型 whisper 本地部署教程(cpu+mps方案)
目录 系统环境:M1pro macOS 13.6 1. whisper 安装 openai-whisper 以下的语言全部支持识别,数字越小的识别越准确 GitHu…
-
ChatGPT 和文心一言两大AI助手的比较
一 背景 ChatGPT是由OpenAI开发的,它可以理解自己生成的内容,并根据输入的上下文进行推理和生成回复。这种自我理解的能力使得ChatGPT在处理复杂对话和问…
-
Speech | 人工智能中语音质量评估方法详解及代码
本文主要讲解人工智能中语音合成,语音转换,语音克隆等生成语音的一些质量评估方法~ 目录 1.语音质量评测方法 主观方法:MOS、CMOS、ABX Test、MUSHRA、PESQ …
-
实战whisper:本地化部署通用语音识别模型
前言 Whisper 是一种通用语音识别模型。它是在大量不同音频数据集上进行训练的,也是一个多任务模型,可以执行多语言语音识别、语音翻译和语言识别。 …
-
chatGPT的耳朵!OpenAI的开源语音识别AI:Whisper !
语音识别是通用人工智能的重要一环!可以说是AI的耳朵! 它可以让机器理解人类的语音,并将其转换为文本或其他形式的输出。 语音识别的应用场景非常广泛,比如智能助理、语音搜索、语音翻译…
-
【小沐学Python】Python实现TTS文本转语音(speech、pyttsx3、百度AI)
文章目录 1、简介 2、Windows语音 2.1 简介 2.2 安装 2.3 代码 3、pyttsx3 3.1 简介 3.2 安装 3.3 代码 4、ggts 4.1 简介 4.…