频率史—从电源频率到音频采样频率与视频帧率:29.97/44.1
Author:zhoulujun Date:
电源频率的标准:电流频率50HZ和60HZ问题
60Hz为美国、日本、加拿大及亲美国家广泛使用。其二极发电机的同步转速为1秒转60圈。每分钟3600转。民用电标准:110V/60Hz
50Hz为欧洲及苏联及受苏联影响地区使用。其二极发电机的同步转速为每分钟3000转。发电机转速较低,对机器设备的制造、安装和调试精度要求较低,相对成本也较低。民用电标准:220V/60Hz
60Hz的发电机是3600转的,50Hz的是3000转的
我国电力工业主要是苏联来的,所以同苏联,采用了50赫兹。解放前,50Hz与60Hz电网并存于世,之间以变频机组联结交换电力;解放后,60Hz的发电机逐步被淘汰。目前我国大陆、港澳已成为单一50Hz电网的国家。台湾依旧是110V/60Hz。日本50Hz于60Hz并存。这里推荐阅读《为何中国电压是220V?220V电压的由来》
PAL制式与NTSC制式
世界上的录像机主要有二大制式。就是欧洲的PAL制式和美国日本的NTSC制式。
NTSC制式:1952年由美国国家电视标准委员会指定的彩色电视广播标准,它采用正交平衡调幅的技术方式,故也称为正交平衡调幅制。美国、加拿大等大部分西半球国家以及中国的台湾、日本、韩国、菲律宾等均采用这种制式。
NTSC制式,场频59.94Hz(接近但不是60Hz,为了抗干扰),行频15575Hz,每一场525条扫描线。适用于NTSC制式录像机的编码器,其采样频率就是44.056。早期,日本确有一些采用44.056kHz采用频率的数码录音,但后来统一到44.1kHz了
PAL制式:1962在西德(德国苏控区)被指定为彩色电视广播标准,它采用逐行倒相正交平衡调幅的技术方法,克服了NTSC制相位敏感造成色彩失真的缺点。苏联、西德、英国等一些西欧国家,新加坡、中国大陆及香港,澳大利亚、新西兰等国家采用这种制式。PAL制式中根据不同的参数细节,又可以进一步划分为G、I、D等制式,其中PAL-D制是我国大陆采用的制式。
PAL制式录像机的编码器,其采样频率就是44.1kHz。
SECAM制式:SECAM是法文的缩写,意为顺序传送彩色信号与存储恢复彩色信号制,是由法国在1956年提出,1966年制定的一种新的彩色电视制式。它也克服了NTSC制式相位失真的缺点,但采用时间分隔法来传送两个色差信号。使用SECAM制的国家主要集中在法国、东欧和中东一带。这里算是比较偏门,就不讲了。
44.1kHz与44.056kHz的由来
44,100= 50 x294 x 3=50×9×7×7×2
44,056= 59.94 x 245 x3
50Hz和59.94Hz分别是PAL和NTSC的场频, 294和245是从PAL和NTSC的线数上来的,因为是隔行扫描的,所以扫描线数要除2。故此PAL的扫描线就变成312.5而NTSC则变成262.5。但在模拟电视时代,为确保电视画面内容完整,所以摄像机,录像机,电视机都采用过扫描技术,最上,最下,最左,最右的部分都给舍去了。因此,无论PAL还是NTSC制式的实际扫描线,都比625和525少。PAL制式下可用扫描线数是294线,而NTSC则是245线。至于x3,则是在一条视频扫描线的磁迹中,纪录三个数码音频数据块。于是,就有了上面的式子,就有了44.1kHz。
音频采样率列表:
常见音频采样频率:
8,000 Hz - 电话所用采样率, 对于人的说话已经足够
11,025 Hz-AM调幅广播所用采样率
22,050 Hz和24,000 Hz- FM调频广播所用采样率
32,000 Hz - miniDV 数码视频 camcorder、DAT (LP mode)所用采样率
44,100 Hz - 音频 CD, 也常用于 MPEG-1 音频(VCD, SVCD, MP3)所用采样率
47,250 Hz - 商用 PCM 录音机所用采样率
48,000 Hz - miniDV、数字电视、DVD、DAT、电影和专业音频所用的数字声音所用采样率
50,000 Hz - 商用数字录音机所用采样率
96,000 或者 192,000 Hz - DVD-Audio、一些 LPCM DVD 音轨、BD-ROM(蓝光盘)音轨、和 HD-DVD (高清晰度 DVD)音轨所用所用采样率
以前一直被教育,说音频范围是20HZ~20KHZ,那么我就以为是人耳能听见这范围。其实人耳真正能听到的范围是在90-15.1K Hz(15.1K Hz是人耳的极限),这是最理想的时候,随着年龄增大和其他原因,实际的听力范围要远远小于它,主要在高频方面,随着年龄增大下降明显。人的听力范围是由生理结构所决定的,不可能超出,长时间生活在高频的环境里,人只能感觉到烦躁,是不是主观察觉到它的存在那只有天知道,低频做为一种能量,人通过皮肤能察觉到,而非听到。
由于人耳对不同频率的解析度不同,MPEG1/Audio将22khz内可感知的频率范围,依不同编码层,不同取样频率,划分成23~26个临界频带。下图列出理想临界频带的中心频率与频宽。图中可看到,人耳对低频的解析度较好。
对于音频存储于播放,20kHz足够,但是对于音频采样,模拟时代的音频生产中,由于滤波器、效果器的性能问题,一般会使用极高的采样率,来给畸变留出空间。44.1Ksps是一个常用的采样率,对应的带宽是22.05KHz,这个频率是由协议规则,取这样一个值可能是考虑时钟分频的方便(9×7×7×2×100)。40KHz 以上的采样一定可以确保准确还原 20KHz 的信号,这有香农定律证明;12帧的连续图片看起来就是运动的,为什么还有电影的24帧、30帧、48帧、60帧以及120帧?同理高频采样可以跟细腻地还原低频采样,虽然边际效应很明显,但的确有所提高
Nyquist采样定律:采样率大于或等于连续信号最高频率分量的2倍时,采样信号可以用来完美重构原始连续信号。
实践中 44.1KHz 和 48KHz 所留出的余地也足够应付滤波器带来的畸变等。在数字电路角度来考虑,高采样其实是把大量的采样噪声向高频转移。反正高频你听不见,有噪声就有噪声呗~噪声不能消除,但是巧妙的规避了。
音频位深度
44分贝 - 属于人类可以接受的程度
55分贝 - 开始感觉到烦
60分贝 - 开始没有睡意
70分贝 - 令人精神紧张
85分贝 - 长时间让人无法接受而捂住耳朵
100分贝 - 可让你你的耳朵暂时失去听觉
120分贝 - 可以瞬间刺穿你的耳膜
160分贝 - 碎玻璃
200分贝 - 人类死亡
一般CD就是44.1Hz/16bit 采样。我们常见的16Bit,可以记录大概96分贝的动态范围,每一个比特大约可以记录6分贝的声音。同理,20Bit可记录的动态范围大概就是120dB;24Bit就大概是144dB。
假如,我们定义0dB为峰值,那么声音振幅以向下延伸计算,那么,CD音频可的动态范围就是"-96dB~0dB。",依次类推,24Bit的HD-Audio高清音频的的动态范围就是"-144dB~0dB。"。由此可见,位深度较高时,有更大的动态范围可利用,可以记录更低电平的细节。
频域上的掩蔽效应
幅值较大的信号会掩蔽频率相近的幅值较小的信号,如下图:
时域上的遮蔽效应
在一个很短的时间内,若出现了2个声音,SPL(sound pressure level)较大的声音会掩蔽SPL较小的声音。时域掩蔽效应分前向掩蔽(pre-masking)和后向掩蔽(post-masking),其中post-masking的时间会比较长,约是pre-masking的10倍。
参考文章:
CD为什么采用44.1kHz采样频率的问题 https://www.jianshu.com/p/d49cdc2f716d
转载本站文章《频率史—从电源频率到音频采样频率与视频帧率:29.97/44.1》,
请注明出处:https://www.zhoulujun.cn/html/res/scienceTechnology/Encyclopaedia/8020.html