语音识别

AI时代再进化！GitHub上热门AI工具大PK！

目录结构 📋前言 ⛳️1. 神鬼级手绘大师：几笔草图即刻变3D全景！ ⛳️2. AI 引领的音乐革命！一键创作，成为自己的音乐之王！ 📋前言 🌈个人主页：Sarapines Pr…

乘风
Python 2023年11月13日
4800
如何使用 Rask AI 进行视频本地化

链接： Login or Sign up Rask AI 是一个提供视频本地化服务的平台，支持 60 多种语言。该服务的主要功能包括： VoiceClone：利用 AI 生成来自…

乘风
Python 2023年11月13日
5900
深度学习应用-WeNet语音识别实战01

概括本文对WeNet声音识别网络的Python API上介绍的Non-Streaming Usage和 Streaming-Usage分别做了测试，两者本质相同。…

乘风
Python 2023年11月10日
5300
多模态情感识别-MISA: baseline解读

零. 背景 1. Introduction 多模态情感分析是一个活跃的研究领域，它利用多模态信号对用户生成的视频进行情感理解。解决这一任务的主要方法是开发复杂的融合技术。（1）然…

扎眼的阳光
Python 2023年11月10日
6700
第14章-Python-人工智能-语言识别-调用百度语音识别

百度语音识别API是可以免费试用的，通过百度账号登录到百度智能云，在语音技术页面创建的应用，生成一个语音识别的应用，这个应用会给你一个APIKey和一个Secret…

青葱年少
Python 2023年11月10日
4500
数字人系列一：10分钟打造AI对话数字人（平台提供数字人和问答库）

最近有很多数字人开发者看了B站频道”小智同学来了”,找我们要了源码和教程，开发者反馈了一些问题，希望我们提供详细的教程，我们也将一些反馈整理如下： 1、NLP文字OnNLPDriv…

乘风
Python 2023年11月7日
6400
基于达摩院modelscope语音模型，实现20句话声音克隆合成

基于达摩院modelscope语音模型，实现20句话声音克隆合成基于达摩院modelscope语音模型，实现20句话声音克隆合成

xiaoxingxing
Python 2023年11月3日
7100
【Java】人工智能交互智慧导诊系统源码

随着人工智能技术的快速发展，语音识别与自然语言理解技术的成熟应用，基于人工智能的智慧导诊导医逐渐出现在患者的生活视角中，智能导诊系统应用到医院就医场景中，为患者提供导诊、信息查询等…

乘风
Python 2023年11月2日
6000
CTC-Loss

目录 1. CTC-Loss概述为了解决输入和输出对齐问题，标记未分割序列数据是现实世界序列学习中普遍存在的问题，如图像文本识别（OCR）、姿势识别、语音识别（ASR） CTC…

扎眼的阳光
Python 2023年11月2日
5300
音频特征提取

1 常用的算法 https://www.kaggle.com/competitions/birdsong-recognition/discussion/172573 MFCC (M…

扎眼的阳光
Python 2023年10月19日
8400