Linux Alsa
ALSA文件定义位置 : /system/core/include/system/audio.hamixer -c 1 controlsamixer -c 1 sget usbCapture_volamixer -c 1 cget numid=5,iface=MIXER,name='usbCapture_vol'arecord -laplay -l官网:https://www.alsa-proje
ALSA
Alsa官网:https://www.alsa-project.org/wiki/Main_Page
音频通路 : https://wenku.baidu.com/view/dacb0922af45b307e87197a2.html
ALSA设备文件结构
命令 : cd /dev/snd ; ls -l
crw-rw----+ 1 root audio 116, 8 2011-02-23 21:38 controlC0 用于声卡的控制,例如通道选择,混音,麦克风的控制等
crw-rw----+ 1 root audio 116, 4 2011-02-23 21:38 midiC0D0 用于播放midi音频
crw-rw----+ 1 root audio 116, 7 2011-02-23 21:39 pcmC0D0c 用于录音的pcm设备
crw-rw----+ 1 root audio 116, 6 2011-02-23 21:56 pcmC0D0p 用于播放的pcm设备
crw-rw----+ 1 root audio 116, 3 2011-02-23 21:38 seq 音序器
crw-rw----+ 1 root audio 116, 2 2011-02-23 21:38 timer 定时器
其中,C0D0代表的是声卡0中的设备0 ; pcmC0D0c最后一个c代表capture ; pcmC0D0p最后一个p代表playback。
音频参数的理解
声道
- 单声道:mono
- 双声道:stereo。最常见的类型,包含左声道以及右声道
- 2.1声道:在双声道基础上加入一个低音声道
- 5.1声道:包含一个正面声道、左前方声道、右前方声道、左环绕声道、右环绕声道、一个低音声道,最早应用于早期的电影院
采样率
音频采样,是把声音从模拟信号转换为数字信号。采样率,就是每秒对声音进行采集的次数,同样也是所得的数字信号的每秒样本数
采样越高,声音的还原就越真实越自然,人对频率的识别范围是 20HZ - 22000HZ, 如果每秒钟能对声音做 22000 个采样, 回放时就足可以满足人耳的需求. 所以 22050 的采样频率是常用的, 根据奈奎斯特采样定理44100Hz是不失真的情况下的采样率, 超过48000的采样对人耳已经没有意义。
采样位数
采样位数是指采样时候的计量单位,8bit (也就是1字节) 只能记录 256 个数, 也就是只能将振幅划分成 256 个等级;16bit (也就是2字节) 可以细到 65536 个数;
样本格式
样本组合格式
- 交错(interleaved)。以stereo为例,一个stereo音频的样本是由两个单声道的样本交错地进行存储得到的,即A1-B1-A2-B2-A3-B3样式存储。
- 平面(planar)。各个声道的样本分开进行存储,即A1-A2-A3-B1-B2-B3样式存储。
样本格式
enum AVSampleFormat {
AV_SAMPLE_FMT_NONE = -1,
AV_SAMPLE_FMT_U8, ///< unsigned 8 bits
AV_SAMPLE_FMT_S16, ///< signed 16 bits
AV_SAMPLE_FMT_S32, ///< signed 32 bits
AV_SAMPLE_FMT_FLT, ///< float
AV_SAMPLE_FMT_DBL, ///< double
AV_SAMPLE_FMT_U8P, ///< unsigned 8 bits, planar
AV_SAMPLE_FMT_S16P, ///< signed 16 bits, planar
AV_SAMPLE_FMT_S32P, ///< signed 32 bits, planar
AV_SAMPLE_FMT_FLTP, ///< float, planar
AV_SAMPLE_FMT_DBLP, ///< double, planar
AV_SAMPLE_FMT_S64, ///< signed 64 bits
AV_SAMPLE_FMT_S64P, ///< signed 64 bits, planar
AV_SAMPLE_FMT_NB ///< Number of sample formats. DO NOT USE if linking dynamically
};
U8(无符号整型8bit)、S16(整型16bit)、S32(整型32bit)、FLT(单精度浮点类型)、DBL(双精度浮点类型)、S64(整型64bit),不以P为结尾的都是interleaved结构,以P为结尾的是planar结构。
Planar模式是FFmpeg内部存储模式,我们实际使用的音频文件都是Packed模式的。
比特率
每秒的传输速率(位速, 也叫比特率)。如12.5kbps 或 12500bps, 其中的 b 是 bit, ps 是每秒(per second)的意思,表示每秒12500bit的容量。压缩的音频文件常常用倍速来表示,譬如达到CD音质的MP3是128kbps/44100HZ。注意这里的单位是bit而不是Byte,一个Byte=8bit(位),bit是最小的单位,一般用于网络速度的描述和各种通信速度,Byte则用于计算硬盘,内存的大小。
alsa相关函数及文件
函数及结构体
-
AVFrame iFrame 存储非压缩的数据,输入
-
AVFrame swapFrame 存储非压缩的数据,重采样
-
AVPack oPacket 压缩即编码后的输入,输出
-
snd_pcm_hw_params_get_rate( )
-
snd_config_update_ref
这个函数作用是检查alsa配置文件是否发生了变化,包括文件名字和各个配置文件的内容是否修改,如果有修改,就重新加载配置文件树,刷新全局变量snd_config并增加一个snd_config的引用计数,调用snd_config_update_ref传入的top就是指向snd_config的指针,这个top当作参数传入snd_pcm_open_noupdate函数中。snd_config_unref接下来会减去snd_config的引用计数。
首先创建顶层配置节点,然后打开/usr/share/alsa/alsa.conf,加载文件内容到顶层配置节点上,然后遍历所有的hooks,调用snd_config_hooks加载所有hooks,并调用相关的hooks函数打开对应的plugin动态库。 -
avcodec_open2( )
检测指定的codec和context里面的codec是否匹配。
分配空间。
检测codec各个参数合法性,并给某些字段赋初值。
调用codec的init初始化codec。
释放资源,返回。
配置文件
参考网址 : https://www.cnblogs.com/lihaiping/p/alsaconfig.html
配置文件的调用过程
alsa-lib库 : alsa-lib-1.2.1.2/src/pcm/pcm.c
snd_pcm_open( ) 函数作为打开一个pcm的接口. 具体的调用过程是 : static snd_pcm_open_noupdate ----> static snd_pcm_open_conf( )
解析asound.conf过程 : https://www.xuebuyuan.com/1043778.html
snd_pcm_open内部直接解析的是usr/share/alsa/alsa.conf, 在这个文件中决定了etc/asound.conf和/.asoundrc这两个文件要不要调用
音频设备的定义
文件定义位置 : /system/core/include/system/audio.h
enum {
AUDIO_DEVICE_NONE = 0x0,
/* reserved bits */
AUDIO_DEVICE_BIT_IN = 0x80000000,
AUDIO_DEVICE_BIT_DEFAULT = 0x40000000,
/* output devices */
AUDIO_DEVICE_OUT_EARPIECE = 0x1, // 听筒
AUDIO_DEVICE_OUT_SPEAKER = 0x2, // 扬声器
AUDIO_DEVICE_OUT_WIRED_HEADSET = 0x4, // 线控耳机,可以通过耳机控制远端播放、暂停、音量调节等功能的耳机
AUDIO_DEVICE_OUT_WIRED_HEADPHONE = 0x8, // 普通耳机,只能听,不能操控播放
AUDIO_DEVICE_OUT_BLUETOOTH_SCO = 0x10, // 单声道蓝牙耳机,十进制32
AUDIO_DEVICE_OUT_BLUETOOTH_SCO_HEADSET = 0x20, // 车载免提蓝牙设备,十进制64
AUDIO_DEVICE_OUT_BLUETOOTH_SCO_CARKIT = 0x40, // 立体声蓝牙耳机
AUDIO_DEVICE_OUT_BLUETOOTH_A2DP = 0x80, // 十进制128
AUDIO_DEVICE_OUT_BLUETOOTH_A2DP_HEADPHONES = 0x100, // 十进制256
AUDIO_DEVICE_OUT_BLUETOOTH_A2DP_SPEAKER = 0x200, // 十进制512
AUDIO_DEVICE_OUT_AUX_DIGITAL = 0x400, // 十进制1024
AUDIO_DEVICE_OUT_ANLG_DOCK_HEADSET = 0x800, // 十进制2048
AUDIO_DEVICE_OUT_DGTL_DOCK_HEADSET = 0x1000, // 十进制4096
};
alsa插件
asound.conf配置 https://www.alsa-project.org/main/index.php/Asoundrc
插件配置 https://www.alsa-project.org/alsa-doc/alsa-lib/pcm_plugins.html
生成alsa配置文件 : alsactl store -f a.conf
对于耳机的controls需要指定-c 1,默认走的是card 0
播放音频的命令 arecord -D usbheadsetC -d 5 -f cd -r 48000 -c 2 -t wav test.wav
//查看控件
# amixer -c 1 controls
numid=3,iface=MIXER,name='PCM Playback Switch'
numid=4,iface=MIXER,name='PCM Playback Volume'
numid=6,iface=MIXER,name='usbCapture_vol'
numid=5,iface=MIXER,name='usbPlay_vol'
numid=1,iface=PCM,name='Capture Channel Map'
numid=2,iface=PCM,name='Playback Channel Map'
//对控件进行配置
# amixer -c 1 sget usbCapture_vol
Simple mixer control 'usbCapture_vol',0
Capabilities: volume
Playback channels: Front Left - Front Right
Capture channels: Front Left - Front Right
Limits: 0 - 255
Front Left: 100 [39%]
Front Right: 100 [39%]
# amixer -c 1 cget numid=5,iface=MIXER,name='usbCapture_vol'
numid=5,iface=MIXER,name='usbCapture_vol'
; type=INTEGER,access=rw---RW-,values=2,min=0,max=255,step=0
: values=100,100
| dBscale-min=-20.00dB,step=0.20dB,mute=0
//查看录音设备
# arecord -l
**** List of CAPTURE Hardware Devices ****
card 0: smartpenknot [smartpen_knot], device 0: i2s-ecodec nau8822-hifi-0 []
Subdevices: 1/1
Subdevice #0: subdevice #0
card 0: smartpenknot [smartpen_knot], device 1: dmic dmic-codec-hifi-1 []
Subdevices: 1/1
Subdevice #0: subdevice #0
card 0: smartpenknot [smartpen_knot], device 2: i2s-tloop pcm-dump-2 []
Subdevices: 1/1
Subdevice #0: subdevice #0
card 1: EP3C [Meizu EP3C], device 0: USB Audio [USB Audio]
Subdevices: 1/1
Subdevice #0: subdevice #0
//查看播放设备
# aplay -l
**** List of PLAYBACK Hardware Devices ****
card 0: smartpenknot [smartpen_knot], device 0: i2s-ecodec nau8822-hifi-0 []
Subdevices: 1/1
Subdevice #0: subdevice #0
card 1: EP3C [Meizu EP3C], device 0: USB Audio [USB Audio]
Subdevices: 0/1
Subdevice #0: subdevice #0
alsa音频工具
arecode录音
- 查看录音设备 : arecode -l
- 命令实例 : arecord -D hw:0,1 -d 10 -f cd -r 44100 -c 2 -t wav test.wav
- 参数解析 :
-D 指定了录音设备,0,1 是card 0 device 1
-d 指定录音的时长,单位 : 秒
-f 指定采样格式,通过上面的信息知道只支持 cd cdr dat
-r 指定了采样率,单位 : Hz
-c 指定channel 个数
-t 指定生成的文件格式
aplay放音
- 查看放音设备 : aplay -l
- 命令实例 : aplay test.wav
如果是直接播放pcm数据,则需要指定pcm格式 、采样率、channel个数等。例如:aplay -t raw -r 16000 -e signed-integer -b 16 -c 1 test.wav
amixer配参
使用方法 :
- 用 # amixer controls 列出所有控制项。( 显示接口函数 )
- 如果对控制项不熟悉或者想查看当前的所有配置可以使用 # amixer contents 命令。(显示当前配置)
- 查看获取某个设置项的值用 # amixer cget + 控制参数 命令。 这里控制参数直接复制 # amixer controls 打印出来的数据就可以
- 根据控制参数类型设置控制参数使用 # amixer cset + 控制参数 + 设置参数 命令。
values 表示数值对于 volume 之类的是具体的数字,在上下文菜单中有显示数值的范围,对于 switch 之类的表示开关一般是 on 或 off。
另外一sget/sset系列的命令, 与cget/cset的使用相同
//例:
//给的参数看value需要几个,需要什么类型进行相应的配置即可
/ # amixer cget numid=43,iface=MIXER,name='Speaker Playback Volum'
numid=43,iface=MIXER,name='Speaker Playback Volume'
; type=INTEGER,access=rw---R--,values=2,min=0,max=63,step=0
: values=63,63
| dBscale-min=-57.00dB,step=1.00dB,mute=0
/ #
/ #
/ # amixer cset numid=43,iface=MIXER,name='Speaker Playback Volum' 30 30
numid=43,iface=MIXER,name='Speaker Playback Volume'
; type=INTEGER,access=rw---R--,values=2,min=0,max=63,step=0
: values=30,30
| dBscale-min=-57.00dB,step=1.00dB,mute=0
/ #
保存及恢复方法
- 对声卡信息状态进行保存 : alsactl store -f /var/lib/alsa/asound.state
- 声卡状态恢复命令 : alsactl restore -f /var/lib/alsa/asound.state
Linux音频分析工具
- 名字 : audacity
- 下载方法 : sudo apt install audacity -o Acquire::http::proxy=“http://…/”( -o 参数可以指定代理)
- 使用方法 : 直接命令行 audacity , 添加音频观察即可
Q&A
Q1:数据存储出来只有78字节,但是写函数已经执行完毕?
A1:这只是写了一个文件头,而最终文件没有写入。原因是:avio_open之后没有关闭,调用closep函数之后数据正常写入;
调试流程:首先定位问题位置。在alsa录音完成之后将数据写入buffer中存储来看是否是alsa部分的录音问题。之后根据流程进行检查。一定要注意open close / new delete / 等配套的使用
av_write_trailer的作用
- 循环调用interleave_packet()以及write_packet(),将还未输出的AVPacket输出出来。
- 调用AVOutputFormat的write_trailer(),输出文件尾。 avio_closep的作用 关闭输出文件的上下文,与avio_open相对应使用
这两个的使用需要保证av_write_trailer函数调用早于avio_closep 如果不调用这两个函数会导致最终文件不能写出
Q2:重采样时 channel 可以正常转换, sample_rate采样率变化不能转换?
A2:在做采样率的重采样时, 对输出的context配置需要将采样点也做一下转换,否则已经转换成功但是生成的文件大小还是按照以前的输出进行.
采样点转换函数 : av_rescale_rnd(iFrame->nb_samples, oSampleRate, iSampleRate, AV_ROUND_UP);
Q3 : 录音之后声音太小, 甚至有时候听不到, 需要如何调整?
A3: 通过amixer参数进行相应的配置.
/recode # amixer cset numid=53,iface=MIXER,name=‘DMIC GAIN’ 15
numid=53,iface=MIXER,name=‘DMIC GAIN’ ;
type=INTEGER,access=rw—R–,values=1,min=0,max=31,step=0 :
values=15 | dBscale-min=0.00dB,step=3.00dB,mute=0
//此步骤完成了dmic增益调整为15的过程
Q4: 耳机音量小但是amixer没有相关可以配置的参数?
A4: 通过asound.conf配置新的插件。
更多推荐
所有评论(0)