- 手机:
- 15206033845
- 电话:
- 0898-08980898
- 邮箱:
- admin@eyoucms.com
- 地址:
- 海南省海口市
最新加盟企业:索尼 松下 索贝数码 中科大洋 品尼高 奥维迅 北大方正 新奥特 Belden百通 NVISION
您的位置:首页在线期刊特别报道所属专题:音频工作站 所属期
【内容提要】本文主要介绍了数字音频的嵌入过程和实际的应用,以及相关的标准。
随着数字电视技术的发展,数字播控中心也成为各电视台建设的重点,这也是从模拟向数字化过渡的特殊时
期,不可能从采编到播出全部实现数字化,特别是音频系统,从模拟音频到数字音频,再到数字音频的嵌入,这是
对于视频、伴音分离的系统,在电视信号模数转换和传输的过程中,视频和音频不同的处理方式和特点,导致
在电视节目播送中,视频信号制约于相应的音频信号,达到互相同步,或利用数字视频信号对数字音频信号加
以携带,形成一个有机统一的整体(音频嵌入技术),同时又能安全的解出,以使受众得到声画同步的完美的电视
以我台播出部为例,简单解释一下音频信号的流程:由于我台仍然有大量的电视剧录像带是Betcam带,而本台
自办节目是DV带,所以用于上载的录像机就有Betcam和DVCPRO两种,我们统一使用模拟音频信号输出,它首先通过
一个音频限幅器,对输入的音频进行自动增益控制和过峰值控制,到Profile视频服务器的音频接口盒,将模拟音
频转换为AES/EBU数字音频,通过输入音频编码板编码为文件存入硬盘盘塔;从盘塔返回Profile的音频文件解码后
通过输出板嵌入到SDI视频信号中。在QMC切换台上,为了能够调节输出伴音,又将带嵌入音频的SDI信号分解成SDI
视频和AES/EBU数字音频,再将AES/EBU数字音频通过一个D/A转换成模拟音频进行音量调整,然后经A/D转换成
AES/EBU数字音频,再嵌入到SDI视频中输出,这是目前音频嵌入式播出系统的普遍模式。
音频嵌入式电视播出系统,相对于音视频分离模式的系统,有着很多优点。一般来说,音频嵌入模式适合于较
大型系统中的各种切换,达到灵活轻便。切换中的音视频的协调统一,是靠程序控制中央处理器的统一指令完成
的,而中央处理器的程序设计很容易实现,运作简单、实用、可靠。对于小型系统,音频嵌入也有一定的使用价
1992年,美国音频工程师协会(AES)和欧洲广播联盟(EBU)共同制定了数字音频的接口标准,即AES/EBU数
字音频格式。在这个基础上,国际电信联盟将其归纳为ITU-RBS647-2号建议书《广播演播室数字音频信号的接
AES/EBU的构成:由两个信号通道组成。这两个声道可作为立体声的左、右声道,可作为独立的声道,可将两
在视频领域,我们对视频的取样为8比特或10比特,而对于音频来讲,10比特是远远不够的,它不能满足声音
每一个取样组成一个32位的副帧,前4位为通道状态识别位,指示后面的音频数据是哪一个通道的音频数据,
其后4位的辅助数据(可以用它扩展AES/EBU为24比特)然后是20位的音频取样数据,音频取样数据之后是一位音频
取样有效位,用来指明音频取样的比特位数是否有效。在其之后用户比特位用于携带其它信息,例如:时码。第31
位为音频通道状态位,它可以携带与信号有关的重要信息:例如取样频率、声道类型、辅助比特的应用方式等,最
由192个副帧进一步组成一个数据帧,每一个数据帧的起始点由第一副帧的前4位的状态位来表述,即前置位表
AES/EBU数字音频信躁比高,传输质量好。是独立的音频通道,便于做音频处理(调音处理)对于75欧的
在电视领域,音频信号出现“唇音”是我们非常关注的问题。所谓的“唇音”指的是由于视频信号和音频信号
传输路径不同,因此信号的延时也不同,这样就造成了声音和图像出现延时差。在分离的视、音系统中需要一些音
频延时器予以克服。而在数字视频SDI的传输的同时,我们可以利用SDI信号的辅助数据区,把数字音频信号嵌入到
SDI信号中一起传输,从根本上消除了的除了“唇音”问题。这也就是传输音频信号的第3种格式—嵌入音频格式。
在模拟视频中存在着行、场消隐期。在行、场消隐期内并不存在着有效图象信号。对于数字视频信号,也对应
存在这样一个时间区间,这个区间被称为行、场的辅助数据区。行辅助数据区由SMPTE定义为“HANC”
我们清楚地知道,分量数字视频格式的有效行中,625/50制共有1728个取样字(525/60制为1716个取样字),
其中对Y、Cb和Cr取样有1440个取样字(0~1439)。而对行消隐期间的取样可安排288个取样字(525/60制为276个
取样字)。数据传送中,每行的消隐期间的数据是相同的,对于数字化来说就是所谓的“冗余”部分,在标准中用
“SAV”和“EAV”,予以界定并作为接收端恢复的标志,就不再需要传送同步和色同步信息了。那么在“EAV”和
“SAV”之间就可用来放置288个字(525/60制为276个),作为辅助数据(包括“EAV”和“SAV”的8个字)。因
此,模拟视频中的行消隐期间,在数字视频中被称为行辅助数据区“HANC”(Horizontal Anicillary Data)。
同样,模拟视频中的场消隐期间,在数字视频中被称为场或帧辅助数据区,由EBU定义为“VANC”(Vertical
Anicillary Data)。我国广播电影电视行业标准GY/T160-2000《数字分量演播室接口中的附属数据信号格式》,
是等效采用ITU-RBT1364建议书标准,规定了数字分量演播室应用的嵌入到视频数据信号中的辅助数据格式(图
(1)在每个数据包的最前面,有一个包头(ADF)。对于分量系统是由3个字组成,它们为:000H、3FFH、
(2)其次是表明辅助数据之内容的数据识别码ID(DID),用于组织嵌入音频所使用的数据包。
(3)在数据识别码之后是数据包号码(DBN),接收设备可根据包号码的连续性来判别是否丢失数据。
(4)数据包号码之后1个字称之为数据计数字(DC),用来表明包中数据总和。
分量视频数据信号的辅助数据区,可用来传输数字音频等辅助数据信号。辅助数据信号以数据包的形式运载,
每个包都带有自身的包头标识,在辅助数据区内,不可随意放置。依据标准规定,插入在数字视频的串行数据流
中,可以同时发送多达16个通道,(8个AES/EBU数据流通道)20或24比特的声音信号。但必须紧接在EAV后面,不
能有一个码字的空隙。误码检测信号EDH(SMPTE RP165定义)被放置在行辅助数据区的第5或315行(625/50制),
但必须紧邻在“SAV”前面,同样不能有一个码字的空隙。行辅助数据区的剩余部分,可安排其它数据使用。
第8、321行用于插入音频控制数据:该音频控制包包含以下信息:音频的帧数、取样的频率、有效通道和视、
音的相对延时,对于48KHZ的工作方式下,音频控制数据包的是可选择的,而对于其它频率,必须传送音频控制数
在广播电视系统中,数字音频的取样频率通常采用48KHz(其它取样频率有32KHz和44.1KHz),在每秒25帧的
扫描系统中,一个视频帧的音频样值数为48000/25=1920,即一个视频帧内有整数个音频样值,这时音频的取样频
率能和视频时钟保持同步,可称为同步音频。在数字音频中,通常将由同一AES/EBU音频源中得到的两个音频通道
称为一个通道对,由两个通道对组成一个音频组。这样,一个音频组可以有4个音频通道。音频组的编号为1至4,
目前辅助数据最大的用途是放置音频,然而被放置的音频称为嵌入音频。采用音频嵌入方案的电视系统,最大
的好处是解决了电视信号在传输中的声画同步、协调的问题。由于嵌入音频后的视频信号可用一根电缆同时传送音
被嵌入的音频信号是以块(或称段)为单位,打包传送的。一个块由192个连续帧组成,每个帧包含有相关的
两个子帧,每个子帧(32比特)表示一个音频通道,放置一个音频取样字,因此一个数字音频码流可以作为立体
每个子帧定义为32比特,其中前置码占有4比特,音频数据为24比特,在数据位后的4比特,分别是有效标志位
如果音频取样频率为48KHz,一帧的取样时间为20.83μs,每一子帧的取样时间就是10.415μs。帧传输速率与源
嵌入音频实质上是采用时分复用的方式,将数字音频数据作为附属数据与数字视频数据合为一路数据信号。嵌
入音频放置在行辅助数据区内(HANC),按照SMPTE272M标准的规定,在行辅助数据区内最多可嵌入16个通道的音
频数据,16个通道划分为4组,每组含有4个(即两对)音频通道。为此需要使用两种用来传送AES/EBU音频信息的
附属数据包,即音频数据包和音频控制包。这两种音频包均应符合下表所示的附属数据包的格式,它们之间的差别
表1是音频数据包和音频控制包的用户数据标识字。可以看出,通过DID字,既可以识别音频数据包和控制数据
音频数据包中携带有数字音频的样值数据,按照标准规定,它放置在CB/CR色差信号并行数据流的行附属数据
区内。音频控制包中所含数据则用于音频数据流的解码处理,每场仅传送一次。有关音频数据的嵌入过程和这两种
图4表示了音频数据的嵌入过程。为简明计,这里只画出了一个通道对(AES/EBU 1为第一通道对,AES/EBU 2
音频控制包的作用是为接收端提供必要的解码信息,如音频通道对的取样频率和同步/异步指示、通道的有效
音频控制包位于场消隐切换点之后的第二个行辅助数据区内,即位于奇数的第8行和偶数场的第321行。每场传
送一次, 音频控制包中含有音频帧序号、取样频率和各通道音频/视频间的相对时延等信息,对于48KHz同步运行模
按规范和使用经验,嵌入音频数据字是均匀地放置在各电视行中,这样最有利消除很敏感的伴音和画面口形的
在GY/T161-2000《数字电视附属数据空间内数字音频和辅助数据的传输规范》明确规定,数字音频和辅助数据
的映射,应符合GY/T158-2000《演播室数字音频信号接口》的规定,即应为AES/EBU音频,用于串行视频附属数据
信号接口》标准的规定,信号格式还应符合GY/T160-2000《数字分量演播室接口中的附属数据信号格式》的规定。
在GY/T161-2000规范中还明确指出,48kHz取样且时钟锁定(同步)于视频信号的音频,是演播室应用的优选
实施方法。也指出这个标准也支持取样频率为32~48kHz的同步或异步取样AES/EBU音频。
在GY/T161-2000规范中在配置一节指出,将从一个或多个AES/EBU帧及一个或两个通道对中得到的音频数据配
置到音频数据包中。通常情况,一个通道对的两个通道是从同一AES/EBU音频源中得到的。一个音频数据包中包含
的每个通道的样值数目取决于在视频场内数据分配。比如,某些电视行的附属数据空间可以运载3个样值,而另一
些电视行中可以运载4个样值,或者还有其他数目。就是说对现有的某些设备可能传输其他数目(包括零个)样
数字音频嵌入SDI视频信号后,可以通过监测仪器来查看数字音频嵌入的位置和对它的格式的分析。
从图中可以清楚地看出嵌入音频的位置和对应的DID字,在行辅助数据区(HANC)内,从1440开始是EAV的四个
字(3FF,000,000,XYZ),紧跟着是从1444开始的嵌入数字音频的四个字(000,3FF,3FF,DID)。
从图中可以看出每一个AES音频通道的取样为24比特;通道用途为专业通道;数据用途为音频;取样频率为
48KHZ;通道模式为2通道立体声;用户字节模式为192个副帧组成的包;音频字节长度为20位;还有通道状态数据
纵观当今科学技术的发展,速度之快、变化之大都是前所未有的。高新技术的发展也同样地冲击着广播电视领
域,我们广播电视工作者对其在引进、开发和应用方面,进行了积极的探索和实践,取得了扎实的成果,并在许多
方面都获得成功应用的经验。高新技术的进步给广播电视带来了严峻的挑战和激烈的竞争,同时又提供了巨大的发
展机遇。我们相信在新的世纪里,电视高新技术必将更广泛、更迅速地发展和普及,其中数字化进程会进一步加
快,全面贯彻于电视节目的制作、播出、传输和储存的各个环节,直至千家万户。
根据科学进步的规律,嵌入音频的应用就更为重要。从电视节目的制作、播出、微波和光缆传输,卫星节目传
送和数字电视广播等,都要有音频嵌入技术的结合,并已逐步地以行业标准的形式予以确认。例如我国参考ITU-R
BT1365建议书制定了GY/T162-200《HDTV串行接口中作为附属数据信号的24比特数字音频格式》,就是确定音频嵌
入技术应用的标准。音频嵌入技术将成为电视发展,网络化普及的基础技术之一。
· 演播室有源线阵列扬声器扩声系统设计安装调试浅谈[图] (2006-9-8)
· 为更好地监控高清ARC和音频信号制定新标准[图] (2006-9-19)













