音频
-
Android13音频子系统分析(三)—音效算法集成框架
目录 Android的音效架构中,将所有的音效算法全部挂载到AudioHAL进程中运行。根据音效算法应用的位置,可以分为三类:Track音效、Stream音效、De…
-
2024年集创赛FPGA紫光同创赛道男女声,童声变声
1.前言: 本代码是笔者参加2024年集创赛紫光同创赛道,在网上的代码,论文,课设等基础上编辑出来的一款带有GUI界面的数字变声器,变声效果良好,可以直接运行,有相…
-
从声音到形象,AIGC 赋能的 TT 语音年度盛典有多好玩?
摘要: 23年是 AIGC 暴热的一年,这一年我们既兴奋又彷徨。兴奋之处在于新技术持续突破,业界“百模大战”的白热化,一些创新应用开始崭露头角,例如 ChatGPT 和 DALL·…
-
用Python做信号处理
用Python做信号处理 声明:本文中设计的知识和代码大部分来自:芥末的无奈的博客_CSDN博客-音频处理,c++,keras领域博主 以及 凌逆战 – 博客园 (cn…
-
使用matlab/python进行双门限法的端点检测
目录 1.双门限法原理 2.双参数的双门限端点检测的实例 3.python实现双门限法端点检测 端点检测是指从包含语音的一段信号中确定出语音的起始点和结束点位置. 在进行基于音频信…
-
【AI 孙燕姿 | AI 音色克隆】RVC 使用图文教程:无难度男女换声(伪音)、 AI 孙燕姿
最近,视频网站音乐区up主掀了“AI孙燕姿”的风潮。这种使用AI技术提取某位歌手的音色,再用其替换另一位歌手音色的方式,可以实现接近歌手本人翻唱的逼真效果。除孙燕姿外,面对周杰伦、…
-
深入理解MFCC(梅尔频率倒谱系数)
从倒谱图出发 MFCC是Mel Frequency Cepstral Coefficient的简称,要理解MFCC特征,就需要先明白这里引入的一个新的概念——Cepstral,这个…
-
AI天后,在线飙歌,人工智能AI孙燕姿模型应用实践,复刻《遥远的歌》,原唱晴子(Python3.10)
忽如一夜春风来,亚洲天后孙燕姿独特而柔美的音色再度响彻华语乐坛,只不过这一次,不是因为她出了新专辑,而是人工智能AI技术对于孙燕姿音色的完美复刻,以大江灌浪之势对华语歌坛诸多经典作…
-
【飞桨PaddleSpeech语音技术课程】— 一句话语音合成全流程实践
(以下内容搬运自飞桨PaddleSpeech语音技术课程,点击链接可直接运行源码) 一句话语音合成全流程实践 点击播放视频 1 声音克隆介绍 & 语音合成基本概念回顾 语音…
-
深入理解ECAPA-TDNN——兼谈Res2Net、ASP统计池化、SENet、Batch Normalization
概述 ECAPA-TDNN是说话人识别中基于TDNN的神经网络,是目前最好的单体模型之一 关于TDNN,可以参考深入理解TDNN(Time Delay Neural Network…