科普 一首音乐怎么能达到GB的容量 浅谈音频码率中的数学问题
今天个人首页偶然推送此位阿噗主的稿件,出于好奇点开稿件后就看到观众的各种不明所以的惊叹。对于一位对多媒体处理有一定经验的阿噗主,觉得是时候科(zhuang)普(x)一波了。本专栏是为了通过数据计算科普计算机多媒体编码与储存基本常识。
特别注:每位阿噗主的原创投稿都应该得到尊重,本专栏引用以上视频只是为了引出话题,没有任何其他含义。头图是阿噗主自行拼接的,图片来源于网络。
我们从阿噗主的视频中可以观察到以下有用信息(懒就不截图了x)
音频格式以及封装信息:WAV容器,192KHz采样率,64bit位深,码率24576Kbps
音频大小:1328947481字节,1.23GB
音频长度:07:12
很多小伙伴看到后:哇,7分钟的歌,1G多,好厉害!!!
下面窝会从数据角度解析一首歌怎么会达到这样的大小——其存在的合理性。
音频文件码率=位深x采样率x声道数
请记住以上公式,本期专栏所有计算都围绕以上公式
为了方便萌新理解,以下做不严谨非标准通俗解释:
文件码率:文件每秒钟的数据量。常见单位:Kbps比特率,1Kbps正确理解为1Kb per second,即为每秒1千比特数据量。
音频文件采样率:对现实的声波每秒采样(取样)的次数。常见单位:Hz,1Hz正确理解为每秒采样1次,因为计算机只能储存离散的数据,故只能对连续的声波进行采样。根据香农采样定理,采样率决定了文件能记录的声音频率,这点不展开说明。
音频文件位深:每次采样的数据量。顾名思义,每次采样的可记录数据量。
声道:通俗理解,常见双声道就是左右两个声道。
其实公式合理性很好理解:码率(每秒数据量)=每次采样的数据量x每秒采样次数x声道数
下边开始计算啦!!
1GB=1024MB 1MB=1024KB 1KB=1024B 1B(字节)=1b(比特)
1328947481字节(B)那么换算后就是1.23GB
截图所示数据计算
已知音频文件大小和音频码率,我们很容易求解出音频长度:
时长=音频文件大小/音频码率=1328947481B/(24576Kbps x 1000 /8)=432.6s=07:12
(看不懂得注意单位换算哦,还有就是1024还是1000进率问题不展开讲了哦)
是不是可以发现这个音频容量“吓人”的“”罪魁祸首”了?是音频码率太高了,比较于MP3最高音质320Kbps,24576Kbps的码率太“奢侈”了,那么问题来了,这个音频码率为什么会这么高?
是时候套用前边提到的音频码率计算公式了:
音频码率=位深x采样率x声道数=64bit x 192KHz x 2 = 24576Kbps
所以这个音频码率就应该是24576Kbps !!
其实当看到192KHz/64bit的时候心里就已经清楚了,文件大小应该是常见96KHz/24bit Hi-Res规格歌曲的5倍多,常见Hi-Res歌曲根据格式和时间长度不同可能在100-200MB之间,那么这个歌曲1.23GB的大小完全在合理之中。
上边的计算已经把我们的所有数据串联了起来,但是专栏写到这里就停止显然是没有太大意义的,上边的计算只是让萌新有直观的体验,下边会再用数据来说明音频编码与容器的一些常识。
常见的MP3的采样率,位深,声道数是多少呢?
常见的MP3的采样率为16bit位深,48/44.1 KHz采样率,声道数为2
那么套用计算公式可以看到文件码率为:1411Kbps(44.1KHz下),1536Kbps(48KHz下)
但是问题出现了,我们常见的MP3码率最高只能320Kbps(也就是俗话说的320K MP3)
问题出现在哪里?出现在格式上!!这里会谈到有损压缩格式,无损格式,无损压缩格式的问题。(为了方便讨论,这里不会忽略细分封装容器与格式的分类)
常见有损压缩格式:MP3 , AAC
常见无损格式:WAV
常见无损压缩格式:ALAC,APE,FLAC
其实看到这里就应该有所察觉了吧——WAV没有压缩,所以它的码率与计算相符,有损压缩格式就是通过有损压缩技术删去并压缩音频有效数据来降低码率来获得低容量音频文件,无损压缩格式是通过无损压缩技术在不损失任何有效数据情况下来降低码率来获得比无损格式更小容量的音频文件。——而有损压缩和无损压缩格式的压缩率就是:各自格式真实码率/理论无压缩码率。
那么48KHz,16bit,双声道的320Kbps的压缩率就为:320Kbps/1536Kbps=20.83%
接下来我将会以一首歌曲演示不同格式的压缩率:
以Kalafina - 《The Best Blue》专辑 - 《To the Begining》Hi-Res歌曲为例
Flac(无损压缩格式)文件信息:
大小:141MB 采样率:96Khz 位深:24bit 双声道 音频码率:4616Kbps
符合Hi-Res级别歌曲标准规格。
下边进行转码操作:
转码操作全程在Adobe Audition中完成
得到WAV无损格式规格:
大小:140MB 采样率:96Khz 位深:24bit 双声道 音频码率:4608Kbps
得到APE无损压缩格式规格:
大小:89.4MB 采样率:96Khz 位深:24bit 双声道 音频码率:2932Kbps
得到Flac无损压缩格式(压缩Level=8)
大小:91.9MB 采样率:96Khz 位深:24bit 双声道 音频码率:3013Kbps
此部分转码压制采用第三方flac编码器完成
各个格式相对于WAV的压缩率:
初始Flac压缩率=141MB/140MB=100.7%
APE压缩率:89.4MB/140MB=63.9%
Flac(Level=8)压缩率:91.9MB/140MB=65.6%
320Kbps MP3对于Hi-Res WAV(96KHz/24bit)压缩率:320Kbps/4608Kbps=6.9%
320Kbps MP3对于同级别WAV (48KHz/16bit)压缩率:320Kbps/1536Kbps=20.8%
(MP3格式最高规格为96KHz/16bit,这里同级别指的是常见的48KHz/16bit规格)
(Flac压缩算法Level 0-8,所以此项由两种Flac,Level=8为最高压缩率)
我们可以得到下边的结论了:
MP3真的很省容量!! 保存WAV没有任何意义!!其实各个无损压缩格式压缩率差距不大!!
那么问题来了,320K MP3真的不能听吗?本文提到的1.23GB音乐真的有意义吗?
其实这个问题在不涉及“玄学”的情况下很难得到合理的答案——每个人的合适答案都不同
有损压缩的意义就是为了在不明显破坏音质下节省容量。
无损压缩的意义就是为了在不破坏音质下节省容量。
Hi-Res高品质音乐的意义是为了相比较常规无损音乐增加数据量,提升细节。
本文中的1.23GB那样的音乐是极端化的情况。
有没有意义除了自己任何人都无法决定。
|科普、一首音乐怎么能达到GB的容量、浅谈音频码率中的数学问题
一首音乐怎么能达到GB的容量 浅谈音频码率中的数学问题 科普