语音识别 | AI技术聚合

《语音识别模式、算法设计与实践》——第二章必知必会的数学基础知识——向量与矩阵

随着机器学习算法的发展，语音识别中几乎所有的模型和算法都是建立在数学的基础之上，数学最大的作用是将具体问题抽象成公式或数字化表示，便于计算机实现自动化运算。 …

扎眼的阳光

IT 4天前

400

【AIGC】深入探索AIGC技术在文本生成与音频生成领域的应用

🚀文章标题 🚀AIGC之文本生成 🚀应用型文本生成 🚀创作型文本生成 🚀文本辅助生成 🚀重点关注场景 🚀音频及文字—音频生成 🚀TTS(Text-to-speech)场景 🚀乐曲/…

心中带点小风骚

IT 4天前

500

AIGC的崛起：定义未来内容创作的新纪元

🌟文章目录 🌟AIGC简介 🌟 AIGC的相关技术与特点 🌟AIGC有哪些应用场景？ 🌟AIGC对其他行业影响 🌟面临的挑战与问题 🌟AIGC未来发展 🌟AIGC十大热门网站推荐：…

青葱年少

IT 4天前

500

[语音识别]开源语音识别faster-whisper模型下载地址

官方源码： https://github.com/SYSTRAN/faster-whisper 模型下载地址： large-v3模型：https://huggingface.co/…

青葱年少

IT 4天前

400

【MacOS】openai 语音识别模型 whisper 本地部署教程（cpu+mps方案）

目录系统环境：M1pro macOS 13.6 1. whisper 安装 openai-whisper 以下的语言全部支持识别，数字越小的识别越准确 GitHu…

乘风

IT 2024年4月10日

800

ChatGPT 和文心一言两大AI助手的比较

一背景 ChatGPT是由OpenAI开发的，它可以理解自己生成的内容，并根据输入的上下文进行推理和生成回复。这种自我理解的能力使得ChatGPT在处理复杂对话和问…

社会演员多

IT 2024年4月10日

1800

Speech | 人工智能中语音质量评估方法详解及代码

本文主要讲解人工智能中语音合成，语音转换，语音克隆等生成语音的一些质量评估方法~ 目录 1.语音质量评测方法主观方法：MOS、CMOS、ABX Test、MUSHRA、PESQ …

xiaoxingxing

技术文章 2024年4月10日

5100

实战whisper：本地化部署通用语音识别模型

前言 Whisper 是一种通用语音识别模型。它是在大量不同音频数据集上进行训练的，也是一个多任务模型，可以执行多语言语音识别、语音翻译和语言识别。 …

心中带点小风骚

IT 2024年4月10日

1400

chatGPT的耳朵！OpenAI的开源语音识别AI：Whisper ！

语音识别是通用人工智能的重要一环！可以说是AI的耳朵！它可以让机器理解人类的语音，并将其转换为文本或其他形式的输出。语音识别的应用场景非常广泛，比如智能助理、语音搜索、语音翻译…

乘风

技术文章 2024年4月10日

1200

【小沐学Python】Python实现TTS文本转语音（speech、pyttsx3、百度AI）

文章目录 1、简介 2、Windows语音 2.1 简介 2.2 安装 2.3 代码 3、pyttsx3 3.1 简介 3.2 安装 3.3 代码 4、ggts 4.1 简介 4.…

扎眼的阳光

技术文章 2024年4月10日

3300