librosa怎么安装_librosa保存音频

序言

一、libsora安装

pypi

conda

source

二、librosa常用功能

核心音频处理函数

音频处理

频谱表示

幅度转换

时频转换

特征提取

绘图显示

三、常用功能代码实现

读取音频

提取特征

提取Log-Mel Spectrogram 特征

提取MFCC特征

绘图显示

绘制声音波形

绘制频谱图

序言

Librosa是一个用于音频、音乐分析、处理的python工具包，一些常见的时频处理、特征提取、绘制声音图形等功能应有尽有，功能十分强大。本文主要介绍librosa的安装与使用方法。

一、libsora安装

Librosa官网提供了多种安装方法，详细如下：

pypi

最简单的方法就是进行pip安装，可以满足所有的依赖关系，命令如下：

pip install librosa

Jetbrains全家桶1年46，售后保障稳定

conda

如果安装了Anaconda，可以通过conda命令安装：

conda install -c conda-forge librosa

source

直接使用源码安装，需要提前下载源码（https://github.com/librosa/librosa/releases/），通过下面命令安装：

tar xzf librosa-VERSION.tar.gz
cd librosa-VERSION/
python setup.py install

二、librosa常用功能核心音频处理函数

这部分介绍了最常用的音频处理函数，包括音频读取函数load( )，重采样函数resample( )，短时傅里叶变换stft( )，幅度转换函数amplitude_to_db( )以及频率转换函数hz_to_mel( )等。这部分函数很多，详细可参考librosa官网 http://librosa.github.io/ librosa/core.html

频谱表示

幅度转换

时频转换

特征提取

本部分列举了一些常用的频谱特征的提取方法，包括常见的Mel Spectrogram、MFCC、CQT等。函数详细信息可参考http:// librosa.github.io/librosa/feature.html

绘图显示

包含了常用的频谱显示函数specshow( ), 波形显示函数waveplot( )，详细信息请参考http://librosa.github.io/librosa/display. html

三、常用功能代码实现读取音频

>>> import librosa
>>> # Load a wav file
>>> y, sr = librosa.load('./beat.wav')
>>> y
array([  0.00000000e+00,   0.00000000e+00,   0.00000000e+00, ...,
         8.12290182e-06,   1.34394732e-05,   0.00000000e+00], dtype=float32)
>>> sr
22050

Librosa默认的采样率是22050，如果需要读取原始采样率，需要设定参数sr=None:

>>> import librosa
>>> # Load a wav file
>>> y, sr = librosa.load('./beat.wav', sr=None)
>>> sr
44100

可见，’beat.wav’的原始采样率为44100。如果需要重采样，只需要将采样率参数sr设定为你需要的值：

>>> import librosa
>>> # Load a wav file
>>> y, sr = librosa.load('./beat.wav', sr=16000)
>>> sr
16000

提取特征提取Log-Mel Spectrogram 特征

Log-Mel Spectrogram特征是目前在语音识别和环境声音识别中很常用的一个特征，由于CNN在处理图像上展现了强大的能力，使得音频信号的频谱图特征的使用愈加广泛，甚至比MFCC使用的更多。在librosa中，Log-Mel Spectrogram特征的提取只需几行代码：

>>> import librosa
>>> # Load a wav file
>>> y, sr = librosa.load('./beat.wav', sr=None)
>>> # extract mel spectrogram feature
>>> melspec = librosa.feature.melspectrogram(y, sr, n_fft=1024, hop_length=512, n_mels=128)
>>> # convert to log scale
>>> logmelspec = librosa.power_to_db(melspec)
>>> logmelspec.shape
(128, 194)

可见，Log-Mel Spectrogram特征是二维数组的形式，128表示Mel频率的维度（频域），194为时间帧长度（时域），所以Log-Mel Spectrogram特征是音频信号的时频表示特征。其中，n_fft指的是窗的大小，这里为1024；hop_length表示相邻窗之间的距离，这里为512，也就是相邻窗之间有50%的overlap；n_mels为mel bands的数量，这里设为128。

提取MFCC特征

MFCC特征是一种在自动语音识别和说话人识别中广泛使用的特征。关于MFCC特征的详细信息，有兴趣的可以参考博客http:// blog.csdn.net/zzc15806/article/details/79246716。在librosa中，提取MFCC特征只需要一个函数：

>>> import librosa
>>> # Load a wav file
>>> y, sr = librosa.load('./beat.wav', sr=None)
>>> # extract mfcc feature
>>> mfccs = librosa.feature.mfcc(y=y, sr=sr, n_mfcc=40)
>>> mfccs.shape
(40, 194)

关于mfcc，这里就不在赘述。

Librosa还有很多其他音频特征的提取方法，比如CQT特征、chroma特征等，在第二部分“librosa常用功能”给了详细的介绍。

绘图显示绘制声音波形

Librosa有显示声音波形函数waveplot( )：

>>> import librosa
>>> import librosa.display
>>> # Load a wav file
>>> y, sr = librosa.load('./beat.wav', sr=None)
>>> # plot a wavform
>>> plt.figure()
>>> librosa.display.waveplot(y, sr)
>>> plt.title('Beat wavform')
>>> plt.show()

输出图形为：

绘制频谱图

Librosa有显示频谱图波形函数specshow( ):

>>> import librosa
>>> import librosa.display
>>> # Load a wav file
>>> y, sr = librosa.load('./beat.wav', sr=None)
>>> # extract mel spectrogram feature
>>> melspec = librosa.feature.melspectrogram(y, sr, n_fft=1024, hop_length=512, n_mels=128)
>>> # convert to log scale
>>> logmelspec = librosa.power_to_db(melspec)
>>> # plot mel spectrogram
>>> plt.figure()
>>> librosa.display.specshow(logmelspec, sr=sr, x_axis='time', y_axis='mel')
>>> plt.title('Beat wavform')
>>> plt.show()

输出结果为：

将声音波形和频谱图绘制在一张图表中：

>>> import librosa
>>> import librosa.display
>>> # Load a wav file
>>> y, sr = librosa.load('./beat.wav', sr=None)
>>> # extract mel spectrogram feature
>>> melspec = librosa.feature.melspectrogram(y, sr, n_fft=1024, hop_length=512, n_mels=128)
>>> # convert to log scale
>>> logmelspec = librosa.power_to_db(melspec)
>>> plt.figure()
>>> # plot a wavform
>>> plt.subplot(2, 1, 1)
>>> librosa.display.waveplot(y, sr)
>>> plt.title('Beat wavform')
>>> # plot mel spectrogram
>>> plt.subplot(2, 1, 2)
>>> librosa.display.specshow(logmelspec, sr=sr, x_axis='time', y_axis='mel')
>>> plt.title('Mel spectrogram')
>>> plt.tight_layout() #保证图不重叠
>>> plt.show()

输出结果为：

到这里，librosa的安装和简单使用就介绍完了。事实上，librosa远不止这些功能，关于librosa更多的使用方法还请大家参考librosa官网http://librosa.github.io/librosa/index.html

参考：http://librosa.github.io/librosa/index.html

发布者：全栈程序员栈长，转载请注明出处：https://javaforall.cn/200699.html原文链接：https://javaforall.cn

原文地址：https://cloud.tencent.com/developer/article/2150129

你可能想看：

win10未安装音频设备怎么办_win10显示未安装音频设备的解决方法

在安装win10专业版系统后发现一些问题，还没升级系统之后音频设备一切正常，可是升级之后右下角声音图标有一个红叉，然后鼠标靠近就会提示未安装音频设备，今天小编就和大家分享win10显示未安装音频设备的...

电脑上如何剪辑音频剪辑歌曲风云音频处理大师风云音频处理大师

伙计们可以使用各种音频剪辑软件来剪辑这些MP3格式的歌曲，这里我们简单介绍一下可以用电脑剪辑音频的好软件。风云音频处理大师是一个功能强大的音频剪辑软件。支持市面上的音频格式转换、音频剪辑、集成、提取等...

汽车倒车影像怎么安装(汽车倒车影像怎么安装的)

要想安装倒车影像，您的汽车的导航必须支持倒车影像的功能，从车的前部还是后部传输过来的信号导航必须能够转换成图像才行；2、现在大部分的倒车影像都不是在后杠上打孔的了，从倒车影像那里出来两个线，红色的我告...

电脑usb无法驱动怎么安装(电脑usb无法驱动怎么安装软件)

解决方法：1、安装的usb鼠标驱动程序不匹配。也就是说，您使用的usb鼠标驱动程序的操作系统版本、驱动程序说支持的设备型号等与电脑里面安装的设备、操作系统不一致。请按照驱动光盘根目录下的README文...

极品飞车14怎么安装方法《极品飞车14》怎么安装的详细说明？

如何设置“极品飞车14”的详细说明？无需下载极品飞车14安装中文硬盘版本，下载后通过解压缩任意压缩包即可全部解压缩，解压缩后的文件夹中有一个注册表文件，双击注册表导入游戏就是中文。然后您可以运行NFS...

嵌入式安装LED显示屏预留屏幕尺寸及电源线网线布置方法

现在越来越多的场合都开始应用LED全彩屏，来做为宣传的窗口以及播放媒介，除了很多旧设备更新会加装LED全彩屏以外，在一些新建的场合，比如会议室、酒店、展厅等场合都是在前期的设计就默认会安装LED显示屏...

如何用u盘安装linux系统教程(用u盘制作linux系统启动盘步骤图)

您将需要一个包含您想要安装的Linux系统发行版的可引导U盘，　　本教程将带您完成在Windows上创建可引导的Linux系统安装盘。或者在任何支持从USB引导的计算机上安装Linux发行版。该文件包...

Win8高清晰音频管理器在哪 win8系统怎么打开音频管理器

高清晰音频管理器一般在你装驱动的时候就会自动装上去，装完之后就可以对系统的声音进行设置，但是许多win8系统用户并不知道清晰音频管理器在哪，现在为大家带来win8系统打开音频管理器的方法如下。然后可以...

2019中国声音大会聚焦5G时代音频产业，“抓耳”的音频内容是如何炼成的

信息碎片化加剧的时代，音频IP逐鹿“注意力江湖”，需要具备哪些“硬装备”与“软实力”？在音频消费“场景化”的未来，人工智能等全新技术如何大展拳脚？作为上海人民广播电台成立70周年暨“2019上海广播节...

如何制作音频？如何制作音频过原创？

写过好几篇关于如何进行音频创作的文章了，一句话总结就是：音频内容稀缺，竞争小，单价高，制作成本低，这是很多人选择成为音频创作者的重要原因，音频与视频不同，平台并没有原创标签和原创单价之分，但是还是鼓励...

音频设备有哪些数字音频设备是什么意思

数字音频设备是指使用数字技术处理音频信号的设备。数字语音是一种利用数字化手段对语音进行录制、存储、编辑、压缩或播放的技术，是随着数字信号处理技术、计算机技术、多媒体技术的发展而形成的一种全新的语音处理...

免费音频剪辑软件有哪些？音频文件剪辑！

免费音频剪辑软件允许用户对音频文件进行基本的编辑和处理操作，如剪切、合并、提取、转换格式等。还提供了音频效果调整功能，如变调、变速、降噪等。这些功能可以帮助用户优化音频质量，提高听感。一般剪辑软件支持...

音频压缩软件哪个好？好用的音频压缩在线推荐

音频文件过大该怎么处理？在日常工作和生活中会发现，保存过多的音频文件会占用较多的电脑和手机存储空间，音频文件过大也对文件传输和文件兼容也有一定的影响，今天给大家分享4种好用的音频压缩工具，轻松帮你搞定...

住宅担架电梯怎么设计，电梯监控安装怎么安装？？

　　近些年来，电梯的安全备受关注，一些资质高的电梯公司保养费也开始涨起来，公布一下住宅设计规范。　　现批准《住宅设计规范》GB50096-1999局部修订的条文，自2003年9月1日起实施。经有关部门...

竹林七贤竹林[zhú lín]什么意思?近义词和反义词是什么?英文翻译是什么?

竹林[zh鹈lín][竹林]基本说明竹子林[竹林]，详细说明竹子丛生之处。“山海经·大荒北经”：(附睿山)丘南，帝俊竹林在焉，大可为舟。“”史记·司马相如列传“：”观众树的黑暗啊。文章目录：竹林[zh...

MXA920天花麦克风阵列和IntelliMix Room音频处理软件，获Zoom Rooms认证！

Shure进一步帮助IT专业人员和AV经理利用会议解决方案提升协作体验。Microflex Advance MXA920天花麦克风阵列和IntelliMix Room音频处理软件获得Zoom Room...

换气扇怎么安装比较好？换气扇安装需要注意的问题都包括哪些？

换气的作用是排气，排出室内的浊气，湿气，香烟异味，那么在家庭的客厅安装排气扇需要注意哪些问题，一个是排气扇的风量大小，一般是客厅的空间体积的2-3倍，也就是说，一个30平方米大小的客厅，层高在3米左右...

大肚杯吸管安装大肚杯吸管怎么安装

　　　　大肚杯吸管安装需要通过七个步骤来操作完成，本答案通过普通大肚杯进行演示操作，以下是具体操作介绍：　　工具/原料　　吸管　　吸盘　　胶嘴　　1固定吸盘　　拿出大肚杯的吸管，并将其中一头插入吸盘位...

红警mac版怎么安装?苹果电脑如何安装红警游戏?mac红警2

苹果电脑如何安装红警游戏?mac红警2分享给大家，红色警戒 for Mac英文名为Red Alert。红色警戒 Mac是一款非常经典的单机游戏，相信很多玩家都非常喜欢。红警 for Mac合集支持M1...

金利集成环保灶怎么安装以及集成灶安装注意事项

金利集成灶的电源不能留在集成灶的后面，因为插座加插头的厚度可能会使集成灶突出门板之外。但要注意跟用户沟通好柜子背板开孔，集成灶后面的墙上也不能预留插座。因为集成灶的玻璃盖板掀起后会遮蔽插座：集成灶的进...

标签: 特征提取

分享给朋友：

问答百科

librosa怎么安装_librosa保存音频

Copyright © 2024 问答百科网 All Rights Reserved.
蜀ICP备11000655号-9