关于0.9.0生成波形图的说明

在0.9.0版本中,波形的渲染和显示采用了全新的机制,不仅提升了波形图渲染的精度和效果,还大大降低了内存的占用。在硬件配置不高的电脑上应该会有更流畅的体验。

测试素材A为长度为4.5小时(270分钟)的音频。

早期版本

在先前的渲染机制中,提取+渲染该波形图需要占用3.79G内存,耗时106秒。

在早期版本中,采用的是“预渲染”机制,先将音频整体渲染成一张特别长的波形图像,然后把这个图片显示到时间轴中。这就造成了内存耗费的特别厉害。而且波形图像的精度在渲染时就固定了,如果在时间轴中放大显示,会有失真出现。

最新版本

在新版本的实时渲染机制中,仅需要360MB内存,耗时仅31秒。折合每小时素材仅需要80MB内存,真的是非常省心了。

实时渲染不需要预先渲染一张波形图像,而是根据时间轴的可视区域,仅渲染该区域对应的一段波形。当时间轴放大时,波形的显示精度也会随之放大,达到真正的动态精度显示。

此外,用户还可以随时修改波形显示的效果,有常规的“以中线为基准”,也可以使用“以底边为基准”。(在时间轴右侧按钮切换)

QQ20160503-0@2x

以中线为基准

QQ20160503-1@2x

以底边为基准

振幅缩放!

新添加了振幅缩放旋钮,对于那些本身音量很弱的媒体文件,可以很方便的将振幅放大观察,免去了很多烦恼。最小可以缩减至0.5倍,最大可以增至6倍。

QQ20160525-0@2x

原始波形振幅-小的可怜,看不清

QQ20160525-1@2x

调整之后的波形振幅-人声清晰可辨

另外,时间轴右侧还有个闪电状开关,将它按下,可以启用“快速渲染波形”模式。该模式会让波形显得稍有锯齿,并且没有渐变效果。适用于配置比较低的电脑,如果觉得界面不够流畅,可以开启此选项,以便提示流畅度。

频谱图

新版本还引入了一个实验性功能:频谱图渲染。很多音频素材,有人声和配乐混合,仅通过波形图辨别人声起止位置比较困难,而通过频谱图就比较容易了。

该功能采用的也是“预渲染”机制,所以占用大量的内存,渲染A素材的频谱图需要占用13.25GB内存。折合每分钟音频对应的频谱图要占用49MB,所以并不适合比较长的素材,请大家在使用时自己估算并权衡下。

QQ20160503-2@2x

频谱图显示效果(与波形图重叠显示)

通过上图可以看出,人声在频谱图中多以斑马条纹状显示,并随着音调变化,条纹有一定的起伏,通过该特征可以迅速定位人声位置。

测试环境

以上参数基于我的MacBook Pro笔记本电脑,硬件参数如下:

  • 处理器:2.3 GHz Intel Core i7
  • 内存:16 GB 1600 MHz DDR3
  • 显卡:NVIDIA GeForce GT 750M 2048 MB

发表评论

电子邮件地址不会被公开。 必填项已用*标注