一、基本概念介绍
(1) 声音
- 声音由振动产生并在空气中传播
- 声音是由许多不同频率的谐波组成的波
- 谐波的频率范围称为声音的“带宽”
- 计算机处理的声音类型:
- 话音或语音(speech),专指人的说话声音,带宽仅为300~3400Hz
- 全频带声音(如音乐声、风雨声、汽车声等),其带宽可达到20Hz~20kHz(人耳可听见的声音)
- 人耳可听到的声音统称“可听声”(audio),20Hz~20kH
(2) 波形声因数
波形声音,是最常用的 Windows 多媒体特性。波形声音设备可以通过麦克风(将模拟信号转换电信号)捕捉声音,并将其转换为数值,然后把它们储存到内存或者磁盘上的波形文件中,波形文件的扩展名是 .wav。
2、数字音频的采集过程:①采样②量化(模数转换)③编码
(1)取样:取样的目的是把时间上连续的信号转换成时间上离散的信号
(2)量化:量化是把每个样本从模拟量转换成为数字量(8 位或 16 位整数表示);量化的精度越高,声音的保真度越好。
(3)编码:将所有样本的二进制代码组织在一起,并进行数据压缩.
3、数字波形声音的采集设备
(1)音频联机获取设备(声卡)
(1)功能
①、音频采集与编码
②、音频重构与播放
③、MIDI 消息的输入
④、MIDI 音乐的合成
(2)声卡逻辑组成
(3)声卡物理组成(目前集成声卡为主了):
①、主处理芯片:包括数字信号处理器、MIDI 控制、I/O 控制等
②、CODEC 芯片:负责多声道取样、A/D 与 D/A 转换、混音处理等
(4)MIDI 是电声乐器的数字接口,它传输的不是声音信号,而是音符及其控制参数等指令, 它指示音乐合成器演奏哪个音符、多大音量等
(5)DSP——数字信号处理器,用于数字音频的编码、解码、MIDI 声音合成及音频编辑操作等。
(6)声卡分类:独立声卡、集成声卡(软件声卡、硬声卡) .
(2)音频的获取设备:手机、数码录音笔
四、数字音频的表示及其参数
(1)数字音频是使用二进位表示的一种串行比特流,其数据按时间顺序进行组织
(2)主要参数
①、取样频率(采样频率):语音的取样频率低,一般为8k ~16k Hz全频带声音(如音乐)取样频率高(不低于最高频率的两倍(>40kHz)),一般为 44.1k ~ 48k Hz
②、量化位数:通常为 8 位、12 位或 16 位
③、声道数目:单声道为 1,双声道为 2
④、比特率(bit rate),即每秒的数据量
未压缩:码率 = 取样频率 × 量化位数 × 声道数 (基本单位:bit/s,常常考试中会是 kb/s)
压缩:压缩后的码率 = 未压缩时的码率/压缩比
(3)未经压缩的数字音频最常用的文件扩展名为“.wav”
5. 数字音频的数据压缩
(1)数据压缩的必要性:为了降低存储成本和提高在网络上的传输效率
(2)数据压缩的可能性:
①、声音包含大量冗余信息;
②、人耳灵敏度有限,允许有一定失真且不易察觉
(3)数字音频压缩编码的方法:
①、全频带声音:国际标准 MPEG;工业标准 Dolby AC-3
②、电话语音:固定电话使用 ADPCM 编码
③、手机:自适应多速率的 AMR 编码,4.75-12.2 kb/s
六、数字音频文件类型及其应用
(1)日常使用的音频文件(重点掌握):
①、WAV:未压缩的数字音频
②、MP3:指 MPEG-1 audio 层 3 属于有损压缩。记住没有 MPEG-3 编码。
③、WMA:属于有损压缩,压缩比要高于 MP3,质量与 MP3 相当,增加了数字版权保护的措施,防止未经授权进行下载和拷贝。
④、FALC、APE、M4A 采用无损压缩,数据量比 WAV 大约一半,音质保持相同。
(2)数学音频的文件类型及其应用比较
…
版权声明:本文为博主xiaochuhe.原创文章,版权归属原作者,如果侵权,请联系我们删除!
原文链接:https://blog.csdn.net/xiaofengdada/article/details/123067207