光盘见证数码多媒体的30年 影响后世的CD
张伟周 于 2009.05.08 01:39:43 | 源自:www.soomal.com | 版权:原创 | 平均/总评分:09.67/87

我们今天介绍的主要是Audio CD,CD的分支--数据CD在这一篇中不是我们的重点。需要说明的是:要想详细的阐述介绍什么是CD不是只言片语能够解决的事情,从CD诞生至今,前前后后至少发布了不下6部标准,其中包括1980年的第一本红皮书,83年的黄皮书,86年的绿皮书等等,篇幅所限我们在这里不可能介绍的面面俱到。我们从CD的物理特征、容量、速度,到编码、采样角度介绍,说说当年CD的标准给我们的生活带来了什么样的影响。

  • 什么是CD?CD是Compact Disk的缩写,从硬件角度来说是一种直径为120mm(还有一种非主流的80mm规格),厚度为1.2mm的塑料圆盘,中间有一15mm直径的孔洞。 CD盘片多由聚碳酸酯组成,是一片透明的衬底,在数据面覆盖了一张金属(多为铝质)膜,在这张膜上,从圆心到边缘是一圈圈的肉眼无法分辨的数据轨道,数字0和1就在这一圈圈的轨道里以凹坑或非凹坑存储,最后在金属膜上覆盖一层极薄的保护层。从数据角度说,CD是一个存储声音信号轨道的光盘,在这张光盘上,声音以数字化的编码,以数字的形式记录在物理层上,播放时激光头将CD表面扫描轨道上的记录并还原为数字信号,经过解码,还原出声音。

    由于CD的巨大成功,它的物理特性也深刻的影响后世。它的120mm的直径,直接的影响了光驱的大小,光驱的大小为5.25寸,进而影响了主流电脑机箱的大小。巨大的销量,让人们对CD有了一个定性的印象,CD成为了很多产品摄影中的重要参照物。不管数字技术如何进步,新一代的主流光盘尺寸始终都是120mm的。

    容量

    一张CD需要容纳多长的声音?这里还有个小典故。1979至1980年期间,在世界上第一张CD发布前夕,索尼和飞利浦为CD唱片行业设立统一标准进行商谈,CD时长的标准便是围绕着如何或者是否应该坚持单碟CD录下整首“贝九”来讨论。这是因为贝多芬的《第九交响乐》完整的演出往往要超过一个小时,当时的普遍时长为72-74分钟。于是在商谈的最后,索尼公司创始人盛田昭夫坚持认为一张CD应能容下一场完整的“贝九”演出,最终CD的最大时长标准被定在了74分钟之上,这样得出的光盘容量为650M。

  • 在CD刚刚诞生的那段日子,这样的规格并不显得落后,所有的唱片公司都按照这一规格制作唱片,所有的Audio CD最高容量都是74分钟和650M,但650M其实是一个保守的容量,是对当时的技术的一种更保险的妥协。近年来,随着光盘、光头制造工艺的改进,以前为了保险起见而放弃的空间被利用上了,CD容量实现了700M的安全容量,并成为主流,现在市场上购买到得CDR刻录盘大部分都是700M规格的。这个容量上限,也对我们一些熟知的事物产生了重要影响。比如我们常常接触的Divx格式电影,大都都限制在700M以内,这是为了下载后能用一张光盘保存。

    速度

    提到CD的读取,人们常常看到的是nnX倍,这是什么意思呢?最初的CD规范要求:CD读取设备的读取速度为150KB/s,这就是标准的单倍速读取速度,也就是1X的标准。随着技术的发展,这个速度被以几何倍数提升,1X到8X,16X再到24X,最后发展到52X。这里的X很好理解:多少X就是多少倍的150KB/s,例如52X,就是52x150KB/s=7800KB/s。在音乐器材制造领域,CD的读取速度并不是一个被人关心的数据。但在IT领域,CD的读取速度则是非常重要的。

    说到这里有必要多一句:DVD规格里同样有倍速的概念,但是DVD的1X 可就不是150KB/s,而是1380KB/s,远大于CD的150KB/s。

    编码

    声音到底是如何“放置”到CD上去的?这里需要介绍的是另外一个名词:PCM编码。PCM是PULSE CODE MODULATION的缩写,直译为脉冲编码调制。在CD的制作环节中,母带的声音信号经过取样、量化、编码三个环节,完成PCM调制,实现A/D转化,形成数字信号,再经过进一步的纠错和调制,记录到光盘上。播放时,数字信号经过解调和纠错等处理后,得到PCM数字信号,在经过D/A转换还原为模拟的音频信号得到声音。

    在这里我们不用去关心PCM编码到底是什么样的算法,就说说它造成的影响力。由于音乐CD采用了PCM编码,这对后来的音频编解码技术产生了长远的影响,大家熟知的WAV文件,大部分都是采用的PCM编码。在当年,由于技术的落后,PCM的编解码被设计得很简单,它完全没有考虑数据压缩,PCM也因此显得“体态臃肿”,PCM的这个缺点是明显的,受此刺激,出现了大量的压缩音频编解码方案,无损的例如APE、有损的例如MP3。

    说到这里我们引出了另外一个话题:声音的有损和无损,无损和有损都是相对概念。我们常说的无损编码也并不是绝对无损。将原始母带的模拟信号转变为数字的过程,任何编码都不可能绝对的无损转换,只能是尽可能接近原始信号。相对原始母带来说,CD的PCM始终是有损的,相对CD的PCM来说,APE、FLAC等则是无损的,而MP3、MPC等,不管对应什么原始信息,都是有损的。

    采样速率

  • 音频编码离不开采样速率。什么叫采样速率?我们来看上图。采样率就是每秒中的采样次数。采样速率越高,我们得到的波形的轮廓就越接近原始波形,反之,采样速率低的话,我们得到的数字信号就会失真明显。采样速率高了虽然更有利于还原声音,但带来的弊病就是数据文件的庞大。所以,CD采用何种采样速率,也是在音质和文件体积之间寻求一个平衡。在CD里,采样标准是 44.1KHz,也就是每秒钟采样44100个点。那么为什么不是44KHz?也不是44.2KHz呢?这里又有两个小典故:典故之一:在CD发布之前,人们记录高保真的数字信号采用的是录像带,用黑与白代替0和1的方式记录数字信息。而当时的录像带格式是每秒30帧,而每帧又可以分为490线,每一条线又可以储存3个取样信号,因此每秒有30x490x3=44100个取样点,这就是44.1kHz的由来。典故之二:科学界有一个“乃奎斯特抽样定理”是这样说的:“要从抽样信号中无失真地恢复原信号,抽样频率应大于2倍信号最高频率。”而我们都知道音频的最高频率为20kHz,所以取样率至少应该大于40kHz,为了留一点安全系数,再考虑到工程上的习惯,CD标准最终选择了44.1kHz这个数值。两个典故对于44.1KHz的由来都做了貌似真实的阐述,到底哪个是准确的?很遗憾我们也没法告诉你。

    采样大小

    沿时间轴采样,只能记录频率信息,但无法记住频率的信号强度。这就还需要有个“采样大小”。这样才能记录数字信号的轮廓,这个采样大小就就是我们常说的bit,中文叫“位”,比如8bit、16bit,所谓bit(位),就是2的几次方,8bit就是2的8次方,即256。采样大小为8位时, 就是把电平量化为256级,这样声音的强度能出现256级变化。同理16bit可以把电平分成65,536级。位数越高,声音的保真度越高,层次也跟丰富。CD的采样大小最终被确定为16bit,是因为采样大小和声音的动态范围有着最直接的关系,采样大小越高,声音大小的变化也就越大,动态范围也就越高。在当初制定规范时,飞利浦和索尼的工程师针对是采用14bit还是16bit展开过激烈的讨论,飞利浦工程师认为14bit就已经足够用,而崇尚数据的索尼工程师坚持更高规格的 16bit。 最终还是索尼取得了胜利,CD的采样规格定格于16bit。

    还记得1996年起开始兴起的多媒体电脑,一定要配一款“真16位”声卡才算有面子。到此时,音乐CD所确定的16位采样大小的规范,已经有14年了。

    回首

    直径120mm、容量650-700M、两声道,44.1KHz和16bit,这就是音乐CD的典型特征。CD的每一个参数,几乎都对后世产生了重大的影响,无时无刻都在影响着我们生活中方方面面,除了上文中说的那些。你能说说,CD还在那些方面改变了我们的生活吗?

    请评分
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    03
    发表于2010.04.09 23:25:37
    16
    03
    关于采样率,其前提是必须遵循那奎斯特采样定理,至于为什么是44.1K而不是44.2?估计就LZ第一个典故的原因了.
    发表于2009.10.03 17:45:53
    15
    03
    发表于2009.05.15 16:01:52
    14
    03
    特别是杜比TrueHD和DTS-HD 都已经发展到192/24了
    为什么cd还迟迟不动步。虽然现在有好多dts音乐,但是却也未成为主流
    如果真的在超过20的声音人就听不到,那么为什么杜比TrueHD和DTS-HD 还要那么费劲搞192/24?特别是环绕音频从一开始好像就是48而不是 cd的44.1
    发表于2009.05.09 10:22:14
    13
    03
    我又忘记登录了。。。。。。晕死了。。。。每次都莫名其妙的登出。。。
    发表于2009.05.09 10:14:02
    12
    10
    24 192类似的高标准对于我们回放来说可能意义不大,但是对于制作端越来越多的使用到数字化处理,高标准是很有必要的。
    发表于2009.05.09 10:08:21
    11
    221.003.***.***
    221.003.***.***
    那为什么发展到现在,音乐还没有达到192/24
    如果没有意义,那么为什么又有那么多声卡宣称支持192\24?
    发表于2009.05.09 09:51:14
    10
    to LZ “而我们都知道音频的最高频率为20kHz,所以取样率至少应该大于40kHz” 这个其实是人耳所能感觉到的最高频率了,而为什么电话语音的采样频率只有11 Khz或者8 Khz甚至更低,是因为直到4 Khz的声音已经基本涵盖了人们日常生活所有能发出的声音了。
    to 3楼 超过44.1Khz的话, 会有一个问题就是, 超过20Khz的声音, 人是听不见的,如果仍然用48Khz采样的话,那么同样700M的cd,乐曲或者歌曲的长度就会变短,而被占去的空间却是你听不见的无用信号。
    发表于2009.05.09 06:57:03
    9
    CD没有进化可能和传统HIFI产业还没有跟上时代有关吧
    也许有可能跟上来,也许会淘汰。然后是次世代。。。
    发表于2009.05.08 13:02:06
    7
    03
    又学习到新的知识了,收藏的
    发表于2009.05.08 13:01:16
    6
    To搂主:很有意思。学习学习!
    发表于2009.05.08 12:06:42
    5
    发表于2009.05.08 11:32:14
    4
    03
    为什么用了那么多年的44.1和16还没有发展到192/24?
    为什么当初不用48而用44.1?有什么区别吗?
    不知道还有没有下一篇,如果有,希望在介绍一下现在音乐盘片的分类区别用途等等,还有音乐盘片厂商代表盘介绍之类,就像什么黑胶盘啊水蓝盘啊之类的。。还有cd盘片的刻录介绍等等,呵呵。
    发表于2009.05.08 11:00:32
    3
    03
    光盘容易复制,卖盗版盘在中国都算一个大产业了
    发表于2009.05.08 10:26:38
    2
    10
    发表于2009.05.08 09:18:56
    1
    提示
    本贴不可匿名回复,回复等级为:1 ,您现在正处在潜水状态
    回复
    验证码
    7973 为防止广告机贴垃圾,不得已而为之
    表情
    正文
    京ICP备11010137号 京ICP证110276号 京公网安备110114000469号