12种hpv高危阳性严重吗型H P V DN A检测5.88(阳性)<1.00是什么意思

您所在位置: &
&nbsp&&nbsp&nbsp&&nbsp
头颈癌超声热化疗的实验及临床研究(原版论文).pdf69页
本文档一共被下载:
次 ,您可全文免费在线阅读后下载本文档。
文档加载中...广告还剩秒
需要金币:100 &&
你可能关注的文档:
··········
··········
上海第二医科大学 博士学位论文 姓名:任国欣
申请学位级别:博士 指导教师:郭伟 座机电话号码 上海第二医科大学200l级博士学位论文 全文缩略语中英文对照
英文缩写 英文名称 中文名称
5一FU fluorouraeil 5-氟尿嘧啶
AO acridine 丫啶橙 orange factor 凋亡活化因子
apoptosis―activating
LasOase cysteinylaspartate~specifieproteinases 特异性半胱氨酸天冬 氨酰蛋白酶 卿 diaminedichloride顺铂 cis―platin completeresponse 完全缓解 factors 集落刺激因子 colony―stimulating F∞ dimethylsulphoxide 二甲基亚砜 ethidiumbromide 溴化丙啶
∞氓∞叫阻K flow 流式细胞仪 cytometer fluoresceinisothiocvanate异硫氰酸荧光素 hvdroxvcamDtothecine羟喜树碱
H∽旧M亿盯T mitochondrial transitionpore permeabi1ity 线粒体膜通透性转运孔
MR minor 微小缓解 response
MTT thiazoltetrazoliumA 四甲基偶氮唑盐 methyl
MTX methotrexate 氨甲喋呤
NC nochange 无效
OD opticaldensity 光密度
PI iodide 碘化丙啶 propidium
PR ial 部分缓解 partresponse
PS phosphatidylserine
磷脂酰丝氨酸
PTX paclitaxel 紫杉醇
PYM pingyangmycin 平阳霉素
SAS staristica]aria]Ysissystem 数据分析系统软件
SCC eel1 carcinoma 鳞状细胞癌 sQuamous
Tca8113 SCCce]11 ilqe舌鳞癌细胞系 tongue
THP theprubiciHe 吡柔吡星
VCR vincristine 长春新碱
teniposide 鬼臼噻吩甙、替尼泊甙
etoposide 鬼臼乙叉甙、足叶乙甙
Avm mitochondrialtransmembrane potential线粒体跨膜电位 上海第二医科大学2001级博士学位论文 头颈癌超声热化疗的实验及临床研究 中文摘要 目的: 1.通过检测不同的超声加热处理后细胞凋亡水平、线粒体跨膜电位 △v
加熟诱导Tca8113细胞凋亡的机制。 2.以Tca8113细胞系裸鼠移植瘤动物模型为研究对象,检测超声加 热前
正在加载中,请稍后...查看: 615|回复: 0
基于变换的无损音频压缩算法设计
该用户从未签到
基于变换的无损音频压缩算法设计
摘要 数字化音频带给人们更多方便的同时也由于其数据的海量性,给信息的存储和传输造成较大困难,成为阻碍人类有效获取和使用多媒体信息的瓶颈问题之一。解决这一问题的办法,单纯从扩大存储器容量、增加通信干线的传输速率考虑是不现实的,而对数据信息进行压缩,以压缩编码形式存储和传输,在解码端和接收端再对数据解压缩恢复原来信息则是一个行之有效的方法。事实证明,多媒体数据压缩不仅是必要的而且是可行的,原因是声音、图像等信源数据有较强的相关性,即存在大量的冗余信息。可通过去掉冗余信息(去除数据间的相关性)、保留独立信息分量来实现压缩。因此,研究开发高效的音频编码方法,以压缩的形式存储和传输音频信息是很好的选择。随着人们对音频质量要求的提高,如何在保留全部音频信息的条件下,以尽可能大的压缩比压缩音频,从而给人们提供真正透明的音质,成为当前无损音频压缩所面临的主要课题.
关键词: 无损音频压缩,整数变换,整数改进离散余弦变换,嫡编码
1& && && & 第一章绪论 1.1& && &&&课题背景与意义 从1971 年英国BBC 将数字技术用于声音录制开始到现在,数字音频技术已经发展了三十多年,其中具有划时代意义的是八十年代初出现的CD 和数字音频磁带(DAT ) ,它们在诞生之际便向大众展示了数字音频的优点,高保真的质量和高稳定度,但这些优点都建立在大容量的数据存储基础上,传统的CD 和DAT 录制的音频信号是经过44 . 1 或48kHz 采样,每个采样点用16 比特进行PCM 编码。这样,单声道每秒要705 . 6 / 768 Kbit ,立体声每秒要1 . 41 / 1 . 54Mbit 。虽然数据量如此高,但作为第一代数字音频产品的CD 和DAT 主要面向存储,所以依然采纳了这种技术。紧接着出现的第二代多媒体产品,特别是无线系统,受限于带宽和产品成本,无法支持高速率的数据。因此,为开辟新的无线广播和网络多媒体应用,要求在接近透明声音质量的情况下压缩数据量,即编码后重建的声音质量与原始声音对人耳感知上具有不可区分的特性。正是由于这种需求的存在,推动了有损音频压缩技术的迅猛发展。但是由于有损编码后的音质与原声CD 存在区别,并随着压缩码率的降低质量下降,这对追求完美的听众来说难以接受,更无法应用于专业领域和存档系统。现在,随着大容量存储设备的研制、高速宽带网的建设,大大推动了无损音频压缩算法的研究和应用。音频编码从信息是否有所损失的角度可以分为两类:有损音频压缩和无损音频压缩。有损音频压缩也称信息量压缩,这种压缩方法利用了人类听觉对声音中的某些频率成分不敏感的特性,从原始数据中将这一部分人类听觉不敏感的数据去除,以达到压缩的目的。所损失的部分对聆听原始声音的影响较小,却换来较大的压缩比,但是不能完全恢复原始数据是有损压缩方法最大的缺点。顾名思义,无损音频压缩是指在不损失任何音频信息的前提下实现压缩。无损压缩也称冗余度压缩,它利用数据的统计冗余进行压缩,这种压缩方法从数学上讲是一种可逆运算,还原后和压缩编码前的数据完全相同。不存在数据丢失的问题是无损压缩最大的优点。
目前的有损编码标准(如MP3 和AC 一3 )在大多数情况下能够达到良好的主观音质和高压缩比,但遇到数据动态范围较大的音乐(如交响乐等)时,其音质就差强人意了。在一些演播室或者音乐厅环境中,有损编码后的音频效果无法达到期望的逼真度。另外,在音频编辑的过程中经常需要对音频数据作二次编码(即从一种有损格式转换成另一种有损格式,或者格式不变仅改变比特率),如vCD 音频压缩格式为mpZ ( MPEG 一11 盯erll ) ,需转化为mp3 ( MPEG 一1 fayerlll )格式用于因特网上传输。不同压缩格式的码流之间无法直接转化,只能先对mpZ 解码为Pcm 格式,然后对Pcm 进行mP3 编码。由于有损编码丢失了一部分的音频数据,有损压缩格式的二次编码意味着将丢失更多的信息,引入更大的失真。与有损压缩相比,无损压缩后能达到真正透明音质,且在不同的无损格式之间相互转化不丢失任何音频信息。
无损压缩技术可以给人们带来完美音质的听觉享受。以前,由于声卡等电脑多媒体设备的落后,硬盘容量以及网络带宽的限制,人们更多注重于数字音乐编码技术的压缩比,力求在可以接受的品质下将数字音乐文件压缩得尽量小。但随着多媒体设备的发展以及宽带网络建设与大容量硬盘的普及,大部分音乐爱好者对数字音乐文件的期望已经不再是文件尽量小,而是追求所谓的“CD 音质”播放效果。对于希望通过互联网传输CD 音质的数字音乐文件的用户来说,
无损音频压缩无疑是非常有吸引力的一种方法。一种合理的建议是,提供经过有损编码后的压缩的音频给消费者用于网上点播,并且可以提供给喜欢音频CD 音质的消费者一个经过无损音频编码后的音频版本下载收藏。
无损音频技术可以用于专业领域如录音室、演播室和存档系统。在音频编辑过程中如需要对音频信号进行修改或者是不同编码格式之间转换时,无损压缩避免了由于使用有损压缩编码器的多级编解码而导致的音频降质。无损音频编码还应用于存储高分辨率和高采样率音频信号的新DVD 标准中。
无损音频编码也可以用于语音增强、语音识别、说话人识别等需要检测语音特征的应用场合中原始语音的压缩。
无损音频压缩唯一的不足是目前算法得到的压缩比仍不够高,限制了无损音频压缩的广泛应用。随着大容量的存储设备的研制、高速宽带网的建设以及各种无损音频压缩算法的研究,将大大推动无损音频压缩的应用。可以预期,未来应用有损音频压缩的场合都可以使用无损音频压缩代替,如:汽车、家庭影院、消费类音频和个人计算机(PC )等等,从而给人们带来更为完美的听觉享受。
1.2& && &&&无损音频压缩的现状 与有损音频压缩相比,无损音频编码方面的所作研究相对较少。一些著名的时域无损音频编码的方法有Monkeys Andio , Shorten , LTAC , Musicompress 和AndioPak 等算法。总的来看,这些无损音频压缩方法可以分为两类,基于预测的和基于变换的方法。预测编码一般是使用线性预测或者自适应预测器,变换编码一般使用整数DCT 、整数MDCT 和整数小波变换来去除信号的相关性。表1 一1 中列出当前各种无损音频算法,相信它们代表了无损音频压缩算法的现状。
Monkeys Andi 。[3z ] :现有无损音频算法中,Monkeys 音频是对于大部分曲目有着最高压缩比的算法,其编码后后缀名为.APE ,现有大部分的播放器可以直接或者安装插件来播放这种格式的文件。对于联合立体声采用Mid / Side ( M / S ) 编码,将左右声道的信息转化为左右声道的中点(mid )和左右声道之差(side )来编码。采用自适应预测器去除音频样点的相关性,使用Rice 码编码预测系数和残差。
1.3& && &&&无损音频压缩标准(MPEG 一4 ALS )简介 MPEG 一4 提供了基于对象的音频编码方法,包括自然语音、通用音频、结构化音频、音频合成等工具,分别为自然音频、合成音频提供编码合成方法。MPEG 一4 通用音频以改进的AAC 算法为主,应用在除最低码率之外的一般性的音频编码中,并采用TwinvQ 算法来解决CELP 语音编码在处理音乐信号时的缺点;HVXC 和H ILN 是MPEG 一4 提供的参数化编码工具,HVXC 适用于处理语音信号,速率为2 一4 kbPs , H ILN 适用于处理非语音信号,速率大于4 kbP MPEG 一4 sA (结构化音频)的核心sAoL 可以描述声音处理和声音合成算法。由于在档案系统、演播室、宽带传输等许多记录和传输音频信号的应用中,需要采用无损压缩的方式,而AAC 、MP3 等感知音频编码的算法采用有损压缩的方式,MPEG 音频工作组正在进行无损压缩编码技术的标准化工作。MPEG 一4 ALS 标准化的过程及进展如下:
2002 年7 月,MPEG 音频工作组提议提交无损音频压缩技术,并对无损音频压缩方案的兼容性、可分级性以及随机访问能力提出了一些具体要求。这个提议基于两种不同的方法,一种包括有损编码和无损编码的分级系统,另一种只包含独立的无损编码方案的系统。
2002 年12 月,7 家公司分别提交了一种或多种满足基本要求的音频编解码器。
2003 年3 月,MPEG 音频工作组决定首先进行只有无损编码的音频编解码器的标准和工作,同时继续研究分级系统。
2003 年7 月,柏林工业大学提交的编码方案被确定为工作草案。2003 年10 月,将RealNetworks 提议的嫡编码方案添加到工作草案中。MPEG4 已在2004 年底制定了纯无损音频压缩标准(简写为MPEG 一4 ALS ) , 同时对可分级编码方案继续做研究和评估。最终新加坡信息与通信研究院( Institutefo : infocomm Research )的AAz ( AdVanced 灿dio zip )技术被采纳为MPEG 一4 SLS ( MPEG 一4 Scaleable to LosslesS Standard )的参考模型。对于无损音频压缩,为了编解码一致,需对编码器作部分规定。MPEG 一4 ALS 建议的编码器主要模块如图所示。
其压缩过程是:首先利用线性预测(LPC )技术得到预测残差信号,以去除信号间的相关性,再对残差信号进行嫡编码。其中的预测器采用Levinson 一Durbin 算法,自适应地选择最优阶数和系数,再对系数量化和编码,作为参数放入码流中。对残差的嫡编码可动态地在Golomb 一Rice 码和高效块码中选择效率较高的一种,选择索引也放入码流。
另外标准中还包括三个附加选项:随机存取,即可以从任意帧开始解码或剪辑,因此需要对音频信号分帧,每帧独立处理,帧长与采样率有关,根据音频工程师协会和欧洲广播联合会的推荐,帧长选192 的整数倍;块长切换,即每帧自适应地决定是否细分成四个子块,分别选择预测和嫡编码方案;联合立体声编码,即从左声道、右声道和(左一右)声道中选择效率高的两个进行编码。
1.4& && &&&本论文研究内容与主要价值 无损音频压缩从去除信号样值相关性的角度可以分为预测编码和变换编码两种方法。LTAC ( LosslesS Transform Aildio Codec )是上述现有算法中唯一基于变换的算法,它采用离散余弦变换(DCT )去除音频信号的相关性。本课题主要讨论基于整数MDCT 变换的无损音频压缩算法的设计,在计算复杂度允许的情况下,尽可能得到大的压缩比。
本文的研究内容有以下4 个方面:
首先,研究基于提升技术和GivenS 旋转的整数变换,特别是整数DCT 和整数MDCT 的推导和实现过程。分析整数变换中使用的取整次数造成了整数变换后的结果与浮点变换结果之间的误差,以及该误差对反映信号频谱特征的影响。
第二,研究嫡编码技术。分析变换后系数分布的特征,选择合适的编码方法以及编码参数。
第三,研究适合编解码算法的比特流结构设计。
第四,研究无损音频压缩算法的整体架构设计。综合考虑各方面因素,在复杂度允许的情况下,得到较高的压缩比。分析本算法的压缩性能,并与其他现有算法进行比较,指出本算法对于何种类型的音频信号会具有比较好的压缩效率,分析其技术根源。
论文的主要价值在于:
第一,论文证明了MDCT 分解为GivenS 旋转和DCT 的推导过程,在此基础上使用两种提升方案一一“经典提升”和“多维提升”实现IntMDCT 。同时论文对hitMDCT 中复杂的矩阵运算提出了相应简化算法,降低了算法实现的复杂度。
第二,本文对变换后的系数进行了映射处理,并在大量统计分析的基础上,发现经过映射后的IntMDCT 系数的概率分布接近于几何分布,因此算法中采用了Golomb 一Rice 嫡编码技术,并且达到较好的编码性能。由于不同频段内变换系数的幅度差异,本论文对于不同频段的变换系数采用了不同的Golomb - Rice 编码参数以得到最优的压缩效率。
第三,本文提出并实现了一种新的无损音频编解码算法,设计了适合于该无损音频压缩算法的比特流结构,实现音频数据的有效编码。分析了采用两种提升实现IntMDCT 相对于浮点变换结果的逼近误差,以及对于整个算法压缩性能的影响。
第四,论文对本算法的压缩效率、鲁棒性和复杂度等性能进行分析,并与现有无损算法相比较。本算法对于各种音频信号均有较好的压缩效果,特别是对于乐器音频的压缩甚至超过了APE 。
1.5& && &&&论文的结构安排 本论文第二章介绍无损音频压缩的原理和关键技术,第三章介绍整数MDCT 变换的实现,第四章提出基于整数MDCT 的无损音频压缩算法设计,第五章给出算法实现以及性能分析,第六章是总结和展望。
2& && && & 第二章无损音频压缩的原理和关键技术 无损压缩,又称为可逆压缩,无失真编码,无噪声编码。无损音频压缩是指在没有任何音频信息损失的前提下,降低数据量,获得低比特率的音频数据表示。Shannon 在创立信息论时,把数据看成是信息和冗余度的组合,无损压缩的工作原理是去除数据中的冗余度而不损失任何信息,因此是一个可逆的过程。
2.1& && &&&无损压缩的原理 无损压缩的目标是除去数据中的冗余,无损压缩技术中基于上下文关系的无损压缩方法在传输和存储文本以及程序文件中有着广泛的应用,以PkZip 方法为例,它对文本文件压缩后压缩比可达到6 . 55 ,然而这些基于上下文关系的无损压缩方法用于音频压缩,并不能获得理想的效果,PkZip 应用于音频信号时压缩比只有1 . 07 。原因在于音频的信源数据不是相互独立的,是一种有记忆的信源,即相邻样点之间存在着很大的冗余度。因此需要探寻适合音频信号的无损压缩方法。
2.2& && &&&无损音频压缩的方案 目前,无损音频压缩的方案有两类:可分级编码(含无损编码模块)和独立的无损编码。
可分级编码的系统如图2 一1 所示。它是基于有损编码算法发展而成,包括有损编码模块和一个无损增强层。码字c 是输入信号x 经正交变换、量化和嫡编码后的结果。为了达到无损压缩,编码器对c 进行本地解码并产生有损重建信号y , 将其与输入信号x 相减,从而获得差值e ,再对e 进行无损编码。有损压缩编码c 和误差e 的无损编码ce 均需传输。在解码器端,有损解码的重建值加上通过对ce 无损解码得到的误差信号e ,最终获得对输入信号的完美重建。LTAC [ ' 9 ] ( L 。ssless Transform Andi 。codec ,无损变换音频压缩)算法为该方案的代表。上述方案中,可以近似认为有损部分表示原始信号的“轮廓”,而无损部分表示信号的“细节”。因而它特别适合于网络实时应用。当带宽比较宽裕时,可以传输完整的高质量音频;而在带宽受限时便只传输“轮廓’夕,这样在声音质量和网络带宽之间获得良好的折中。
图1 可分级的无损编码方案
随着“整数一整数变换”的出现,独立的无损编码方案也随之发展起来,其结构如图所示。音频信号经过分帧后送入变换模块进行整数变换,变换后的系数依然为整数,对这些系数作嫡编码,并形成压缩码流。解码器的操作与之相反,先进行嫡解码,然后作整数逆变换,恢复出原始数据。由于在整数变换的过程中,使得信号的能量分布更为集中,为嫡编码提供了有利条件,因而可以实现较为有效的压缩。
图2 独立的无损编码方案
两种方案相比,独立的无损编码实现上更为简单。
2.3& && &&&无损音频压缩的关键技术 音频信源的冗余度寓于信源间的相关性中。由信息论的原理可知,音频的无损压缩编码可以分为两步:第一步是去相关,用于降低音频数据的动态范围,去除冗余信息,第二步是编码,采用嫡编码器对残差数据进行编码。建立信源模型的目的是建立一个统计模型,能使估计符号概率接近编码信源的概率。如预测模型或变换模型等对音频数据进行预测或变换来去除它们之间的相关性使之成为不相关信源。
目前,嫡编码技术已经可接近数据的信息嫡,而去相关技术仍有很大的研究余地。无损音频压缩算法已从单纯的嫡编码发展为基于一定的模型去相关后再进行嫡编码的方法。
图3 是无损音频压缩算法典型框图。音频压缩的基本方案:首先将信号分帧,在一帧时间内将音频信号作为短时平稳信号进行处理;去除音频信号样点之间的冗余信息;用有效的编码方案进行编码。
图3 无损音频压缩算法典型框图
下面分析无损编码的几个关键技术。
2.3.1& && && & 分帧 音频信号特性是随时间而变化的,是一个非平稳的随机过程。但是,从另一方面看,虽然音频信号具有时变的特征,但在一个短时间范围内其特性基本保持不变。将音频看作是一个准平稳过程,对音频的分析和处理都必须建立在“短时”的基础上,即进行“短时分析”。因此无损压缩的第一步是分帧操作,将数字音频信号划分为相同长度的段来分析,每一段称为一帧。在一帧时间内将音频信号作为短时平稳信号进行处理,也便于对压缩后的比特流进行编辑,实现随机访问。随即访问可以快速地访问音频编码后的比特流的任一部分,而不需要解码之前的部分。帧的持续时间不能太短,否则编码算法的计算复杂度和用于传输头信息的开销会很大。头信息非常重要,因为它根据每帧输入信号的特征定义了该帧编码算法的参数,而且根据不同的应用场合,头信息中还包含了一些附加的数据,如多媒体的同步信息。另外,帧的持续时间也不能太长,否则无法保证信号的短时平稳性,由于长时间内样点变化剧烈导致预测模型或者变换模型失效,从而无法充分去除样点间的相关性。因此,确定适当的帧长是很重要的。由于音频通常在10 一30ms 之内是保持相对平稳的,因而帧长一般取10 一30ms [ 40 ]。一些算法的仿真结果表明[24 ] [ , 4 ] [ , , ] [ , 6 ] ,一帧持续时间在13 到26ms 之间,对于44 . IkHz 的采样率,对应帧长576 到1152 个样点比较合适。另外为了更好的适应音频信号的快速变化,可根据实际情况将每帧再划分成若干个短块。在LTAC 算法[5 ]的自适应块长模式中,以每M 个样点为一帧,压缩时分别计算变换长度为M , M / 2 和M / 4 点各种块的组合方式,从中选择获得最优压缩比的组合方式。
2.3.2& && && & 预测编码 预测编码是数据压缩技术的一个重要分支,其理论基础主要是现代统计学和控制论。音频的相邻样点之间存在着高度的相关性,即原始数据中存在着大量的冗余。去除这些冗余,信号就可以有效的压缩编码。预测技术是最简单和有效的压缩方法。在已经被传送(接收)的样点的基础上预测当前样点值,假设以x ( n )表示当前样点值,以交(n )表示其预测值,预测残差e ( n ) =交(n )一x ( n )需要被传送。如果预测相当精确,那么预测残差的分布就集中在零值附近,残差信号的零阶嫡比原始信号的零阶嫡大为降低。
预测编码有线性预测和非线性预测两类。其中线性预测(LPC )技术广泛用于音频信号处理的各个方面,其基本思想是由于音频样点之间存在的相关性,可以用过去的样点值来预测现在或未来的样点值,即一个音频样点能够用过去若干个音频样点或它们的线性组合来逼近。
当前时域信号采样x ( n )可以用过去的时域信号采样的预测值来逼近:估计信号;
求解最优的预测器系数有三种方法:自相关法、协相关法和格形法。自相关法可通过莱文逊一杜宾(Levinson 一Durbin )递推算法来高效的求解。
预测编码的关键在于预测算法的选取,这与信号的概率分布有很大关系,实际中常根据大量的统计结果采用简化的概率分布形式来设计最佳的预测器,有时还使用自适应预测器以较好的刻画信号的局部特性,提高预测效率。
2.3.3& && && & 变换编码 另一种去相关的方法是正交变换。信息论的研究表明,正交变换不改变信源的嫡值,由于去除了大部分相关性,在变换域中的信息嫡为高阶信息嫡,使用变长编码就能达到高阶嫡编码。此外,统计分析表明,经过正交变换后,信号能量向新坐标系中的少数坐标集中,便于量化。正交变换本身并不压缩数据量,只是为在新坐标系中的数据压缩创造了条件。
虽然完整表示音频需要大量的数据,但由于音频数据是高度相关的,有着大量的冗余信息。音频压缩的目标就是尽可能去除这些冗余信息。通过几十年的努力,人们对音频压缩进行了大量的研究,提出了很多压缩方法,例如嫡编码,预测编码,变换编码,子带编码等等。变换编码由于其优异的压缩性能,在音频压缩中得到了广泛的应用。
变换编码不直接对时域的音频信号编码,而是首先将时域信号按照某种特定的正交变换或者非正交变换映射到另一个矢量空间,产生一组变换系数,然后对这些系数进行量化和嫡编码。一个最优的变换应该是用最少的比特数得到信号最好的变换域表示,经常提及的变换有:karhunen 一Loeve 变换(狱T ) ,离散Fourier 变换(DFT ) ,离散余弦变换(DCT )和改进型离散余弦变换(MDCT ) 等。
在众多的变换编码中,从压缩效果上看KLT 是一种最佳变换,其最佳性表现在:
( 1 )变换后系数互不相关;
( 2 )数值较大的方差只出现在少数系数中,即在变换域中能量是高度集中的,这样就有可能在允许的失真度内将数据量压缩到最小。虽然KLT 是统计上的最佳变换,但在实现这个变换时仍存在许多困难:首先,KLT 是由信号统计特征唯一确定的,当信号的统计特性不同时,必须重新计算KLT 矩阵;其次,尽管KLT 对于简单的统计模型可以用已知的解析式表示,但是一般来说,KLT 计算是没有可行的快速算法。因此,人们转而寻找能够实时处理的次最佳变换。DCT 是一种最接近KLT 的正交三角函数基变换。由于DCT 算法的计算复杂度适中,具有多种快速算法,故在图像数据压缩中应用非常广泛。
由于DCT 等正交变换在边界处存在着固有的不连续性(只不过不同类型的正交变换,其不连续性的程度不同),因此在这些分组边界处就可能出现边界效应。所谓的“块边界效应”是指由于传统的块变换编码对每个块独立处理,对不同块的变换域系数的量化精度不同,引入的量化噪声特性也不同。这样重建出的时域信号在块交界处会导致感觉上的不连续性。这种现象称为块边界效应。为了消除块边界效应,提出了改进型离散余弦变换(MDCT )。
MDCT 是当前音频变换编码中的主流变换手段,如mP3 , AC3 , AAC 等标准中均使用了MDCT 。MDCT 优点如下:
a ) MDCT 具备完美重建特性,在无限精度条件下可以准确重建信号
b ) MDCT 一次处理M 个数据,产生M 个频域系数。因此MDCT 具有临界抽样的特性,不产生冗余数据,不增加系统的数据负荷
c ) MDCT 可以有效的降低编码重建信号的块边界效应
d ) MDcT 与DFT 之间存在直接的联系,MDCT 变换的系数可以有效表示谱信息。
MDCT 是重叠调制变换,可以利用基于FFT 的快速算法,也可以利用基于DCT 的快速算法来实现。
以上讨论的变换编码的方法都是浮点运算,然而浮点运算有不可克服的缺点如:运算舍入带来的精度误差导致变换无法实现完全可逆,运算速度慢等。在提升方案提出之前就有人从事整数变换的研究,但由于涉及到多个数的取整问题,很难推导其逆变换,所以一直没有太大的进展。直到Sweldens 提出提升方案,整数变换才真正得到发展。无损音频压缩中常使用的整数变换有IntMDCT ( Integer Modified discrete cosine Transform ,整数改进型离散余弦变换)和IWT ( Intege : W 如elet Trans 允rm ,整数小波变换)。它们的基础理论都来自于Daubechies 和SweldenS 的提升方法[6 ] [ 7 ]。在第三章中本文将专门介绍整数DCT 和整数MDCT 的实现,下面简单介绍在第二代小波的理论和提升方案框架下的整数到整数小波变换。
swenldens 等提出的提升算法基于文献「6 ]的理论,即任何一个具有有限长度滤波器的小波变换均可以通过以下方法得到:把信号分为奇数点和偶数点,然后再经过有限次的提升及尺度缩放可获得可逆的整数小波变换。
文献【 7 ]中讨论了怎样将一个利用已有的小波基计算小波变换的问题转化为利用提升方法来计算小波变换,这样将一个较复杂的小波变换问题转化为一个简单的级联的提升过程,典型结构如图2 一4 所示。为了方便地写出用提升方法构造整数小波变换的过程.
将提升过程概述如下:
( 1 )分析过程
(2)&&分析过程
2.3.4& && && & 嫡编码 嫡编码器用于消除变换后系数的冗余度,它本身并不引入失真。最常用的嫡编码方法是Huffman 编码。它利用输入符号的先验概率,概率大的符号使用短码表示,概率小的符号使用长码表示,从而实现信息的压缩。精心设计的Huffman 码本,其输出的平均码长接近信源的信息嫡,即码长的下限。
常用的嫡编码方法有游程编码RLc ( Run Length coding )、霍夫曼编码( Huf 俪an coding )、算术编码以及Golomb 一Rice 编码等等。在无损编码中,由于音频类型千差万别,设计出的Huffman 码本很难适合于各种类型音频的统计特性,无法获得良好的编码增益。因此考虑采用其他的方法,这里主要介绍三种― 算术编码、Golomb 一Rice 码、Elias 一Gamma 码。
首先定义两种基本码:a ( n )和p ( n )。
1)& && &a(n )是一元码,用n 个O 后接1 (或者n 个1 后接0 )表示n
2)& && &p ( n )是二元码,用n 的自然二进制表示n ,从数值的最高位的1 开始
2.3.5& && && & 算术编码 Huffman 码字必定是整数比特长,有时就成为一个问题,如一个符号的概率占90 % ,根据信息论中信息量双xi )的定义
算术编码是80 年代发展起来的一种嫡编码方法,它避开了用一个特定码字代替一个输入符号的思想,用一个单独的浮点数来代替一串输入符号。其基本原理是任何一个数据序列均可表示成O 到1 之间的一个间隔,该间隔的长度为该序列的出现概率。再选择该间隔内一个代表性的二进制数作为实际的编码输出(通常选择最左端的概率作为二进制数)。可以根据信源的统计特性来设计具体的编码器,也可以针对未知概率的信源设计能够自适应适配其分布的算术编码器。有关数据表明[38 ] ,在未知信源概率分布的大部分情形下,算术编码要优于Huffman 编码。
算术编码有两个关键[3v ] ,当前符号的概率和间隔。下面举例予以说明。假设有四个符号,00 , 01 , 10 , 11 ,概率分别为0 . 1 , 0 . 3 , 0 . 4 , 0 . 2 。然后我们为每个符号分配概率间隔:
?& && &&&符号概率间隔
00 0 . 1 [ 0 , 0 . 1 )
0 1 0 . 3 [ 0 . 1 , 0 . 4 )
10 0 . 4 [ 0 . 4 , 0 . 8 )
1 1 0 . 2 [ 0 . 8 , 1 . 0 )
假设我们有一条消息:01 , 11 , 10 ;当每条消息被处理的时候,分配给该符号的间隔比例就变窄,随着编码过程的进行,间隔就越来越窄。处理过程说明如下:
[ 0 , 0 . 1 ) [ 0 . 1 , 0 . 4 ) [ 0 . 4 , 0 . 8 ) [ 0 . 8 , 1 . 0 )
01 一间隔=[ 0 . 1 , 0 . 4 )
11 一间隔=[ 0 . 1 + ( 0 . 4 一0 . 1 ) * 0 . 8 , 0 . 1 + ( 0 . 4 一0 . 1 ) * 1 . 0 )
= [ 0 . 1 + 0 . 24 , 0 . 1 + 0 . 3 )
= [ 0 . 34 , 0 . 4 )
00 一间隔=[ 0 . 34 + ( 0 . 4 一0 . 34 ) * 0 , 0 . 34 + ( 0 . 4 一0 . 34 ) * 0 . 1 )
= [ 0 . 34 , 0 . 34 + 0 . 006 )
[ 0 . 34 , 0 . 346 )
因此,消息被编码为间隔[0 . 34 , 0 . 346 )
2.3.6& && && & Golomb 一Ricc 码 近几年发展起来的Golomb 一Rice 码是一种特殊的Huffman 编码方法,是一个对较宽的嫡条件都有效和可以迅速自适应的无损压缩算法,它在编码时不需要码表,但却能提供与使用多个霍夫曼码表相同的功能[l3 ] [ l7 }。经验认为,当编码信号呈Laplacian 分布时,Gofomb 一Rice 码算法性能优于Huffman 编码和算术编码,因而该编码方法在无损压缩领域引起了广泛的关注。
Golomb 码是一种无符号整型最佳指数分布编码。对于一个整数n ,用其商和余数来描述,除数m 为其参数。如果m 是2 的幂次,n 的码字是前缀。(可m )和用109 mL 匕特二进制表示的n modm 的简单串联而成的,即。(可m ) : p ( n modm )。若m 不是2 的幂次,则可令k 为满足Zk 妻Zm 的最小正整数。码表包括码字长度妻k 的m 个码字和长度为k 一1 的Zk 一1 一m 个码字;韵=Zk 一1 一m , j 个码字用k 一1 比特表示,剩下的m 个码字用k 比特表示。所以,整数n 的Golomb ( m )码由两个码a ( (卜j ) / m ) :斑(n 一j ) % m + 2j )串联得到。例如:m = 4 , , n = 13 ,商和余数分别为3 和1 ,即。(3 ) : p ( 1 ) , 13 的编码111001 。
Rice 码是一种简化的Golomb 码,其参数为k 且m = Zk ( Rice ( k )码即为Golomb ( Zk )码)。整数n 的Rice 码表示为。(n divm )与p ( n modm )的串联,总共n 个比特。
Rice 编码简单快速,而算术编码有较高的计算复杂度;另一方面,Rice 编码器在编码效率上也较接近算术编码;再者,使用Rice 编码器不涉及专利问题。对于按拉普拉斯分布的信源,Rice 算法性能优于Huffman 编码和算术编码[4l ]。
2.3.7& && && & Elias 一Gamma 码 EliasY 码是组成p 码(二进制表示)的比特逆序排列而成,用标志位“O & 来分割每一个比特。标志位“1 ”来表示数值的最高比特位。例如,13 用二进制表示为1101 ,逆序后为1011 ,每一比特之间加上标志位,其EliasY 码为鱼旦。鱼1 , 其中下划线标识的为标志位,最后的比特“1 ”既是标志位又是数据位。Y ’码是Y 码的一种变型,标志位(。码)后接数据位(p 码)。13 的Y ’码为 ( a 码结束位的“1 ”又是p 码的第一个比特)。大多数的文献中“EliasY 码”通常是指Y ’码。
表2 一1 不同编码方法的码字长度的比较
表2 一1 给出上述几种编码的码字长度[8 ]。根据其中的数据,Golomb 一Rice 码对于中等取值的数比较有效,但对数值偏大和偏小的数字没有其他方法好。
2.4& && &&&本章小结 本章从信息论的角度介绍了无损音频压缩的原理,指出当前无损音频压缩两种不同的技术方案:可分级的无损编码方案和独立的无损编码方案。接着阐述当前无损音频算法中所采用的一些关键技术― 分帧、预测编码、变换编码和嫡编码,并深入分析这些技术各自的优缺点,为提出新的无损音频压缩算法提供理论依据和指导。
3& && && & MDCT 变换的整数实现算法 离散余弦变换(DCT , discrete cosine transform )由于其良好的去除数据相关能力和低计算复杂度的特点,已被采纳为图像压缩标准和视频压缩标准的主要变换。但是DCT 用于音频压缩时,由于存在着严重的块边界效应,产生很大的噪声,限制了其应用,因此提出改进型离散余弦变换(MDCT )用于消除块边界效应。
然而传统的MDCT 基于浮点算法设计,在定点实现时由于存在截断误差,往往无法实现完全可逆。因此期望研究整数MDCT ,用整数变换矩阵代替原来的浮点数变换矩阵,或者采用完全可逆的运算,将整数序列映射为整数变换系数,使之实现真正的可逆。
如前所述,整数变换的基础理论来自于Daubechies 和SweldenS 的提升方法[ 6 ] [ v ]。由于DCT 和MDCT 之间有密切的联系,而提升技术是实现整数DCT 的重要方法,因此下面首先介绍两种提升方法,然后再分析整数DCT 的实现,在此基础上实现整数MDCT 。
3.1& && &&&提升格式 3.1.1& && && & 经典提升格式 首先,以上三角矩阵为例来简述提升的思想。
如果变换矩阵可以分解成多个主对角线元素为1 或一1 的三角矩阵的乘积,那么,只要对每一个三角矩阵分别找到其对应的可逆整型变换,然后按分解顺序依次变换,就可构造出整个变换的整型变换。文献【 7 ]就是利用这种思想寻找小波变换所对应的可逆整型变换。这类方法统称为提升,而主对角线元素为1 或者一1 的三角矩阵称为提升矩阵。
可逆整数变换保证变换对于整数信号是真正可逆的,同时其结果与浮点运算结果相差无几,能够有效地降低信号的冗余度,从而为数据的压缩提供有利条件。
音频压缩中经常使用的改进型离散余弦变换(MDCT )可以完全分解为Givens 旋转.
3.2& && &&&整数DCT 3.2.1& && && & 经典提升实现整数DCT 由上述所述的GivenS 旋转的提升方法,可以考虑将DCT 完全分解为Givens 旋转,由GivenS 旋转的提升格式来实现整数DCT 。下面介绍如何将DCT 完全分解为GivenS 旋转。
由于涉及到变换的分解,本论文用矩阵的表示方式来说明会比较清楚。黑体的符号表示一个矩阵,其阶数用下标表示,如果矩阵是方阵,下标只标出行(列)向量的维数。N 是2 的整数次幂。
因此经过归纳推理可以得到:H 、置换后的顺序即为哈达玛顺序(哈达玛
变换核矩阵的行向量的变号次数顺序)。由于哈达玛变换核矩阵存在递推关系
3.2.2& && && & 多维提升实现整数DCT 基于变换的无损音频压缩的整个技术框架是围绕整数变换展开的。因此整数变换的性能非常重要,主要从2 个方面来评价其性能:运算复杂度和对变换系数的逼近程度。对变换系数的逼近程度主要受取整次数的影响,显然减少取整次数能增加逼近程度,同时也能相应地减少复杂度。
3.3& && &&&立体声 该方法同时对两块信号作整数DCTI 、变换,这两块信号可以是来自前后两帧或者是立体声的左右声道。设用D 表示DCTI 、的变换矩阵,由于D 的逆矩阵仍是D ,即DN 只NgDN 只N = IN 。I 、表示N 火N 的单位阵。基于多维提升的思想.
3.4& && &&&单声道 立体声DCT 方法要求同时计算两块的DC 界。变换,如计算相邻块的DC 界。或者同时计算左右声道的DC 界。。然而第一种方法给系统引入了一个块的额外时延,第二种方法只能用于立体声信号。如果要求既无时延又非立体声处理,多维提升的思想依然是可行的,但是需要附加一些GivenS 旋转。长度N 的DC 界。变换核矩阵:
3.5& && &&&整数MDCT 整数MDCT 是MDCT 的整数逼近,具有可逆性,可以通过提升方法来实现,并且保留了MDCT 的大部分优点[l2 }如具有好的频率选择性以及临界采样和块重叠性质。
3.5.1& && && & MDCT 分解 使用前向和后向MDCT 将引入时域混叠误差。误差可以通过两个相邻块t 和t + 1 重叠部分的MDCT 输出相加来消除:
由于正交变换在边界处存在着固有的不连续性(只不过不同类型的正交变换,其不连续性的程度不同),因此在这些分组边界处就可能产生很大的噪声,即所谓的“边界效应”。MDCT 利用时域的重叠抵消技术来减小边界效应。对于输入序列工(k )用本组的N 个样点和前后两个相邻组的各一半的样点重叠构成ZN 个样值,加ZN 点长的窗函数作变换。
本文提出的无损音频压缩算法的整数MDCT 中使用的即为正弦窗。下面介绍将ZN 点MDCT 变换分解为GivenS 旋转和N 点IV 型DCT 变换。
3.5.2& && && & 整数MDCT 的实现 上述分解整个MDCT 变换拆分为加窗、时域重叠抵消和长度为N 的W 型离散余弦变换(DCTIV )等三个步骤,由时域重叠抵消条件可知,加窗、时域重叠抵消步骤可以由Givens 旋转实现。即MDCT 分解为Givens 和W 型离散余弦变换( DCTIV )。由第一节给出的Givens 旋转的整数近似和第二节介绍的采用经典提升和多维提升实现整数DCT ,可以得到两种整数MDCT 变换的实现。
Figure3 一4 MDCT and inverse MDCT by Givens rotations and DCTw 图3 一5 给出了SQAM [ 6 ] (用于主观测试的音乐库)中测试曲目Track64 的IntMDCT 和MDCT 幅度谱以及逼近误差。由图可以看到,整数MDCT 变换后的结果与浮点变换结果相差无几,可以有效去除信号的相关性,良好地表示信号的谱信息。
3.6& && &&&本章小结 本章主要介绍了整数IV 型DCT 和整数MDCT 的实现算法。依据矩阵分解的理论,本文证明MDCT 分解为GivenS 旋转和DCT 变换的推导过程,并在此基础上采用“经典提升”和“多维提升”方案,实现整数改进型离散余弦变换( hitMDCT ) ,并且提出了实际编程中的简化算法。整数MDCT 的充分研究,为将其应用于无损音频压缩做好准备。
4& && && & 基于IntMDCT 的无损音频压缩算法设计 本章提出一种基于IntMDCT 的无损音频压缩算法。由于在整数变换的过程中,使得信号的能量分布更为集中,为嫡编码提供了有利条件,因而可以实现较为有效的压缩。变换后的系数经过Golomb 一Rice 编码并形成码流输出。由于该算法完全可逆,则解码运算是编码运算的逆流程。本章首先详细描述基于IntMDCT 无损音频压缩的编码算法;接着描述相应的解码算法,最后给出适合本文算法的比特流结构设计。
4.1& && &&&编码算法 根据图2 独立的无损音频压缩编码方案,图4给出了本文设计的音频无损压缩编解码方案。
& && && && && && && &图4:无损压缩编解码方案
音频信号首先经过分帧处理。在一帧时间内将音频信号作为短时平稳信号进行处理,并且方便对压缩后的比特流进行编辑以及实现音频信息的随机访问。分帧后的信号送入IntMDCT 变换模块进行整数变换。变换后的系数进行映射后送入Golomb 一Rice 编码器。系数的编码值结合子带划分信息、编码参数等边信息形成压缩码流输出。解码端的操作相反,先进行Golomb 一Rice 解码,然后作IntMDCT 逆变换,恢复出原始数据。由于在整数变换的过程中,使得信号的能量分布更为集中,为嫡编码提供了有利条件,因而可以实现较为有效的压缩。
整数MDCT 模块的设计已在第三章中详细介绍。下面重点介绍编码算法中其他重要模块的设计。
4.2& && &&&Golomb 一Ricc 编码器 经过IntMDCT 变换后的系数均为整数,将其送入嫡编码模块。Golomb 一Rice 编码用于消除变换后系数的冗余度,它本身并不引入失真。Golomb 一Rice 码是一种特殊的Huffman 码,适用于几何分布的正整数信号。为了便于编码,希望对经过hitMDCT 变换后的系数进行映射,从而使得映射后的系数都为正整数。
本文对映射后系数的统计特性进行了估计,如图5 虚线所示,
& && && && &&&图5: 凡何分布(实线)与待编码系数的概率分布(虚线)该图由大量音频信号变换系数的统计结果得到。图中同时给出了几何分布的理论曲线,经过映射后的IntMDCT 系数的概率分布接近于几何分布,因此采用Golomb 一Rice 码可以达到较好的编码性能。
根据数值的范围选择合适的编码参数S ,对于压缩效率有重要的影响。例如
需要对1000 进行编码,表4 一1 给出对于不同的编码参数所使用的编码比特数:
图6 不同GR 编码参数情况使用的比特数
由上表可以看出,使用参数S = 9 或者10 ,可以使用最少的比特数表示样值1000 。如果选择的参数不合适,将造成编码比特数的浪费。因此选择合适的编码参数对于整个压缩算法具有重要的意义。
由于音频信号谱在高低频带呈现出不同的幅度特性,如图4 一3 所示,从图中可以看到,变换后低频部分(0 一4KHz )系数的数值偏大,数值浮动范围大;中频部分(4 一SKHz )数值中等,比较平稳;高频部分(8 KHz 以上)数值普遍较小。因此为了提高编码性能,本文根据信号统计特征的差异,不同的频段内采用不同的编码参数。
4.3& && &&&CRC 检验 从上述编码算法可以看到,算法中一些关键信息如子带数目信息、子带划分信息、GR 编码参数信息对于解码有着重大影响,由于传输存储等错误造成关键信息的读取错误,将会导致整个音频帧的解码错误。因此考虑在编码中对这些关键信息作一些保护。使用的错误检测方法是国际上常用的循环冗余校验码“CRC 一16 ”。如果编码算法中使用CRC 校验,头信息中保护位等于“O & , 并且在比特流中紧随头信息后插入了一个CRC 校验字。
CRC 一16 发生器多项式为:
G ( X ) = Xl ' + Xl , + xZ + 1
移位寄存器的初始状态为“1 1 1 1 1 1 1 1 1 1 11 1111 ’夕,编码时将所有需要进行CRC 一校验的比特输入到图4 一4 & CRC 校验图”中所示的电路中。每输入一比特,移位寄存器移动一位。在最后一个移位操作完成后,输出b15 … bo 组成一字。将这个校验字写入比特流中。解码时,读出关键信息,同样进行CRC 校验后得到校验字,与比特流中的CRC 校验字比较。如果它们不同,则比特流的保护的关键信息出错。
使用CRC 校验提高了算法的鲁棒性。在检测到传输的重要信息出错时,使用重复前一帧或者直接跳过该帧,避免由于解码错误造成的音频失真。
4.4& && &&&立体声编码 以上算法设计中只是利用了声道内音频信号的相关性进行压缩,还可以考
虑利用声道间的相关性提高编码效率即立体声编码,本算法可以考虑采用M / S 立体声编码,将左右声道的信息转化为左右声道的中点(mid )和左右声道之差( Side )来编码,对于两个声道相似度较大的情况,立体声编码方式能比较有效地提高编码效率。
4.5& && &&&解码算法 由于该算法完全可逆,则解码运算是编码运算的逆流程。解码时首先在码流中搜寻12 位同步字“11 ’夕,搜索到同步字后,读出并分析头信息。根据头信息,确定音频的采样频率、字长和声道数。根据头信息中的帧长信息,可以确定下一个同步字的位置,可以实现音频的随即访问。如果头信息中保护位等于“O ’夕,在头信息后读出一个16 比特的CRC 校验字。读出子带数目信息、子带划分信息和参数信息。对关键信息作CRC 校验并与读出的校验字相比较,检查关键信息是否出错。根据子带划分信息计算每个子带内含有多少个样点,由参数信息确定子带内每个样点Golomb 一Rice 的编码参数S 。读出样点信息,根据得到的参数S ,进行Golomb 一Rice 解码。对于每个编码值,读出m 个比特“O ’夕,一个比特“1 ’,S 比特的数值d ,所以经过GR 解码的样点值为n = m 火2s + d 。然后对解码的结果作反映射
对映射后的系数作整数MDCT 逆变换,恢复出原始的音频数据。
4.6& && &&&比特流结构设计 音频帧组织如下:头信息,错误校验,音频数据和附加信息。音频数据包
括边信息(子带数目信息,子带分配信息和参数信息)以及样值信息。
4.6.1& && && & 音频帧 音频帧:含有1024 个样点信息,它起始于一个同步字,终止于下一个同步字,每一帧由整数个字节组成,字节中未使用的多余比特用O 或1 填充。
header ( )
error 一check ( )
audio _ data ( )
ancillary 一data ( )
4.6.2& && && & 头信息 header ( )
version 2 bit
frame len 1 3bit
protection 一bit 1 bit
sampling 一frequency 3 bit
mode 2 bit
word 一length 3 bit
所有帧的开始4Obit ( 5 字节)都是头信息,包含同步和一些状态信息:同步字(syncword ) : 1 6bit , L 匕特串“11 1111 ”作为每一帧的开始版本号(version ) : Zbit ,指明使用哪个版本(算法扩展用)
帧长(frame len ) : 13bit ,给出本帧所用的字节数,即可确定下一同步头的位置,便于实现音频的随机访问
保护一位(protection 一bit ) : lbit ,用来指明编码算法中是否对关键信息作CRC 检验。等于“1 ”表示无校验;等于“O ”表示加入了校验信息
采样频率(sampling 一frequency ) : 3bit ,指明音频的采样频率
字长(word 一length ) : 3bit ,指明原始音频的量化比特数
模式(mode ) : Zbit ,指明编码的模式
4.6.3& && && & CRC 校验信息 错误一检查(error 一check ) : 1 6bit 域:头信息的第31 到39 比特,
error 一check ( )
if ( P rotection 一bit = = 0 ) crc 一check
包含CRC 校验信息。被保护的音频数据比特子带数目信息,子带划分信息,GR 参数信息。
4.6.4& && && & 音频数据 audio 一data ( )
for ( ch = 0 ; ch & ch + + )
subband 一number [ ch ]
for ( sb = 0 ; sb & subband 一 sb + + )
subband 一division [ ch ] [ sb ] parameter [ ch ] [ sb ]
联合立体声(强度立体声或者M / s 立体声)
for ( ch = 0 ; ch & ch + + )
for ( s = 0 ; s & M ; samp + + )
sample [ ch ] [ s ]
音频数据包含子带数目信息、子带划分信息、GR 参数信息、音频样点信息。子带数目信息(Subband 一number 【 ch 」):一帧样点划分为子带个数
子带划分信息(subband 一division [ ch ] [ sb ] ) :给出的信息是关于ch 声道第sb 个子带的划分,32 个样点为一个基带,信息给出ch 声道第Sb 个子带中含有几个基带。
参数信息(paremeter [ ch ] [ sb ] ) : ch 声道第sb 个子带的Golomb 一Rice 的参数信息样点信息(sample [ ch ] [ s ] ) : ch 声道第s 个样点的Golomb 一Rice 的编码表示根据子带划分信息和参数信息,得出ch 声道第s 个样点的Golomb 一Rice 的参数
?& && &&&辅助数据
辅助数据(ancilfary 一data ) :用于辅助数据和多声道扩展
4.7& && &&&本章小结 本章将整数MDCT 应用于无损音频压缩,详细描述音频信号经过整数MDCT 变换后,根据变换系数高低频段的不同幅度分布特性划分子带,每个子带中采用相同的GR 编码参数进行Golomb 一Rice 编码,将子带数目信息、子带划分信息、编码参数信息和编码样点信息形成压缩码流后输出。给出相应的解码算法,并提出适合该编解码算法的比特流结构。
5& && && & 算法实现和性能分析 这一章首先给出本文无损音频编解码算法的具体实现,在此基础上,根据软件仿真的结果,分析算法性能如压缩效率、算法鲁棒性以及算法复杂度分析,并与目前典型的无损音频算法进行比较与分析。
5.1& && &&&算法实现 编码时,首先读入wav 文件,分析wav 文件的头信息,得到原始音频的采样频率、字长和声道数目。根据这些信息设置压缩码流的头信息中的一些状态位。分帧后的信号送入IntMDCT 变换模块进行整数变换。变换后的系数送入Golomb 一Rice 编码器。系数编码后的码字结合子带划分信息、编码参数等边信息形成压缩码流输出。下面给出算法实现时需要考虑的一些问题。
5.1.1& && && & 分帧长度的确定 进行整数变换前,需对音频作分帧操作,以便于数字化音频处理。由前所述,分帧长度对于算法的性能有很大影响,下面通过仿真实验确定算法中采用的帧长。表5 一1 中是不同采样率的情况下,采用不同分帧长度得到的压缩比比较。测试曲目是SQAM ( Sound Quality Assessment Material 一用于主观测试的音乐库)中Track69 ,采样率44 . IkHz 。通过升采样和降采样,得到采样率为32kHz 和48kHz 的音频用于测试。
kHz选用帧长原文件大小
字节压缩后文件大小
字节压缩比
4,987,1242,414,2622.065610242,378,6722.096620482,413,3832.0664
3,618,7161,914,3901.890310241,903,1111.901520481,950,6031.8552
5,428,1602,509,0582.163410242,470,6442.197120482,496,5202.1743图7:不同频率下的帧长选择
通过图7,可以看到,采用帧长1024 可以得到最大的压缩比。下面的仿真算法中采用的都是1024 点帧长。
5.1.2& && && & 模式的选择
由设计的比特流结构,,编码模式可以考虑采用单声道,双声道和立体声编码等方式,若原始音频为双声道数据,可以利用信道间的相关性进一步提高压 缩比即采用立体声编码,下表 给出了采用双声道与立体声两种编码方式得到
的压缩效果,Track69 是 SQAM 中的测试曲目,Track&&L=R 是由 Track69 的右声
道构造,左右声道数据完全相同,表中第一列是原文件的大小,第二列是经过双声道模式编码后的文件大小,第二列是经过立体声模式编码后的文件大小单位,字节,可以看到对于 Track69&&两种方式的压缩比相差无几,而对于左右 声道相关性很大的 Track L=R,立体声编码的方式明显优于双声道模式。
一般来说,两声道数据虽不是完全独立,但由于其相关性较弱,难以用于音频压缩,且采用立体声编码后,计算复杂度大大增加,每两个样点多 3&&次取 整操作,即平均每个样点多 1.5&&次取整操作,,因此下面的测试都是未使用立体
声编码模式。
表 2 不同采样率下的帧长选择
原文件大小
压缩后文件大小
表3 双声道与立体声编码压缩结果
原文件大小
双声道模式
立体声模式
5.2& && &&&整数MDCT 的实现 第3介绍了两种提升的方法― 经典提升和多维提升。基于这两种不同提升,相应有两种实现整数MDCT 的方法。表5 一3 将基于两种提升方法实现整数MDCT 的方法作一比较。表中第二列是基于经典提升实现整数MDCT 的各种指标,第三列是基于多维提升实现整数MDCT 的各种指标,第四列是对浮点MDCT 变换系数直接取整后的结果的各种指标,它不是无损运算。比较的内容包括:平均每个样点的取整次数、指令数(加法和乘法的次数和)、均方误差(与浮点MDCT 变换系数直接取整后的结果相比)和最大误差的绝对值。无损音频压缩算法的整数变换模块分别采用基于经典提升的整数MDCT 和基于多维提升的整数MDCT ,仿真结果表明,在帧长为1024 、未采用立体声编码模式情况下,后者比前者算法平均每帧节省约400bit 。sQAM 中的Track69 原文件大小4 , 987 , 124 字节,经过基于经典提升的算法压缩后,压缩文件大小为2 , 493 , 562 字节;经过基于多维提升的算法压缩后,压缩文件大小为2 , 378 , 672 字节。因此实现时整数MDCT 时采用基于多维提升的整数变换算法。
5.2.1& && && & 子带划分 由第四章算法设计中所分析,不同频段内的信号统计特征有很大区别,因此不同频段内采用不同的编码参数以提高编码性能。本文将整个频带均分为犯个子带,计算每个子带内样点的数学期望,由式(4 一2 )计算每个子带的编码参数。在中高频部分数据变化平稳,合并具有相同参数的相邻子带以节约编码参数所用比特,一般3 、4 个子带公用一个编码参数:低频部分,数据变化剧烈,每个子带使用一个相应的编码参数。
直接取整(有损)
每个样点取整次数
每个样点指令数
最大误差的绝对值
实验结果表明子带划分合并后一般都只传12 个子带左右的参数,每个参数使用4bit 编码,以较少的比特传送了合适的编码参数,得到了较高的压缩效率。
5.3& && &&&CRC 校验的实现 若对关键信息采用CRC 校验,CRC 校验的实现可以采用查表法,由于一个字节是sbit ,所以每次处理一个字节,共有28 一256 项。通过查表法进行运算,大大提高了处理速度,为故大多数应用所采用。本算法中使用的CRC 校验表格见附录。
图8 给出编解码算法的流程图。
图8:编解码算法流程图
5.4& && &&&算法的压缩效率 本文提出的算法采用帧长1024 ,即约23ms 一帧进行整数变换。并且未使用联合立体声编码。实验数据为SQAM [ ' ] ( Sound Quality Assessment Material - 用于主观测试的音乐库)中多种类型的音频信号,采样率44 . IKHz ,每个采样值用16bit 量化。
表8 给出SQAM 中测试曲目经过本文算法压缩后的结果。表中第1 列是SQAM 中各个曲目的名称,第2 列给出每个曲目音频信号的描述,第3 列列出了测试曲目的文件大小,单位兆字节(M Bytes ) ,第4 列测试曲目的持续时间,单位秒(sec ) ,第5 列列出经过本算法压缩后的文件大小,单位兆字节(M Bytes ) , 第6 、7 列给出该曲目的压缩比和平均比特数。
表8仿真结果:
原文件大小( M bytes )
续间、众持时:s (
压缩文件大小( M bytes )
平均比特数( bit )
正弦波(1 KHz )
带限色噪声
合成电子锣( 100Hz )
合成电子锣
合成电子锣( SKHz )
合成电子锣( 500Hz )
乐器(小提琴)
乐器(中提琴)
乐器(大提琴)
乐器(低音提琴)
乐器(短笛)
乐器(长笛)
乐器(双簧管)
乐器(喇叭)
乐器(单簧管)
乐器(低音单簧管)
乐器(巴颂管)
乐器(低音巴颂管)
乐器(萨克斯管)
乐器(小号)
乐器(长号)
乐器(圆号)
乐器(大号)
乐器(竖琴)
乐器(克拉维棍)
乐器(响板)
乐器(小鼓)
乐器(大鼓)
乐器(定音鼓)
乐器(钱)
乐器(铁三角)
乐器(锣)
乐器(管钟)
乐器(钟琴)
乐器(木琴)
乐器(颤音琴)
乐器(玛林巴琴)
乐器(三角钢琴)
乐器(大键琴)
乐器(钢片琴)
乐器(手风琴)
乐器(管风琴)
女声语音,英语
男声语音,英语
女声语音,法语
男声语音,法语
对于不同的音频曲目,本算法的压缩比相差很大。例如,表5 一1 中对于Track60 压缩L 匕可以达到4 . 02 ,而Track64 的压缩比只有1 . 8 。这是由于Track64 中含有合唱和交响乐类型的音频,信号变化剧烈,高频分量十分丰富,如图5 一3 中左图所示,因此很难压缩。相反,对于Track60 ,音频信号比较平稳,高频分量很少,整数变换后信号能量集中于低频部分,去相关效果很好,容易压缩。
女声语音,德语
男声语音,德语
独奏(小号)
独奏(管风琴)
独奏(管风琴)
独奏(吉他)
独奏(小提琴)
独奏(钢琴)
声乐(女高音)
乐(女高音)
乐(独唱)
声乐(合唱)
管弦乐(合唱)
管弦乐(合唱)
从表中对于SQAM 中70 个测试曲目的压缩结果,本算法的平均压缩比为
3 . 17 ,平均比特数为5 . 57bit ,具有良好的压缩效率。
5.5& && &&&实验结果 5.5.1& && && & 算法的压缩效率
本文提出的算法采用帧长 1024,即约 23ms 一帧进行整数变换, 并且未使 用联合立体声编码,实验数据为 SQAM[6]Sound Quality Assessment Material – 用于主观测试的音乐库中多种类型的音频信号,采样率 44.1KHz,每个采样 值用 16bit 量化
下表给出SQAM中测试曲目经过本文算法压缩后的结果,表中第1列是 SQAM中各个曲目的名称,第2列给出每个曲目音频信号的描述,第3列列出了 测试曲目的文件大小,单位兆字节M Bytes第4列测试曲目的持续时间,单位秒sec第5列列出经过本算法压缩后的文件大小,单位兆字节M Bytes
第6,7列给出该曲目的压缩比和平均比特数
正弦波1KHz
带限色噪声
合 成 电 子 锣
合 成 电 子 锣
合 成 电 子 锣
合 成 电 子 锣
乐器小提琴
乐器中提琴
乐器大提琴
乐器双簧管
乐器单簧管
乐器低音单簧
乐器巴颂管
乐器低音巴颂
乐器定音鼓
乐器铁三角
乐器,颤音琴
乐器大键琴
乐器钢片琴
乐器手风琴
乐器管风琴
女声语音,英语
男声语音,英语
女声语音,法语
男声语音,法语
女声语音,德语
男声语音,德语
独奏管风琴
独奏管风琴
独奏小提琴
声乐女高音
声乐女高音
管弦乐合唱
管弦乐合唱
对于不同的音频曲目 本算法的压缩比相差很大 例如 上表中对于 Track60
压缩比可以达到 4.02,而 Track64 的压缩比只有 1.8,这是由于 Track64 中含有 合唱和交响乐类型的音频,信号变化剧烈,高频分量十分丰富,如图 5-3&&中左 图所示,因此很难压缩,相反,对于 Track60,音频信号比较平稳,高频分量很 少,整数变换后信号能量集中于低频部分, 去相关效果很好,容易压缩
5.5.2& && && & 算法的鲁棒性
编码算法中采用分帧处理以及设计的音频帧结构,使得一旦发生数据流的损坏,损失会被限制在两帧以内,避免了误差的传播, 不会造成后面所有数据 的丢失,算法中对关键信息作 CRC 校验,保证了关键信息的准确性。
通过实验,
4 帧的编码数据出现 1 比特误码即误码率为 3.36,10&&5 的情况下,解压后的文 件 SNR 值为 73dB,不影响聆听效果,综上所述该算法鲁棒性能良好,图 5,5 和图 5,6 分别给出不存在以及存在误码时解码得到的波形,两者只是在第一二帧的个别样点幅值上存在差异。
5.5.3& && && & 算法的复杂度
本文提出的音频无损压缩方案, 整体框架简洁, 易于实现,主要的算法复杂度集中于整数 MDCT 变换部分,减少整数变换中的取整次数能增加与浮点变 换结果的逼近程度, 同时也能减少算法复杂度,本算法中使用的多维提升的方法,将 DCTIV 的取整操作降低到 1.5N 次, N 为一帧中的样点数,,加上加窗 时域混叠,IntMDCT 取整操作为 3N 次,比起经典提升的方法 DCTIV 的取整操 作为 (Nlog2N)次,算法复杂度大大降低,,仿真结果表明,普通的 pc 机上,赛扬 2.0G&&256M 内存对于测试曲目 Track69,文件大小为 4,987, 124 字节持续时间 28.271 秒, 无损音频编码时间为 20.7 秒,解码时间 18 秒,今后研究 的重点就是进一步降低各个模块的算法复杂度。
图10 无误码时解码得到的波形
图 11&&误码时解码得到的波形
5.6& && &&&与现有算法压缩性能的比较
将本文提出的算法与几种现有的无损音频算法压缩效果进行比较,,选用的算法是 APE版本 3.99Shorten(版本 3.1)以及 LTAC版本 1.61,自适应块
模式 帧长 4096本文提出的算法采用帧长 1024,即约 23ms 一帧进行整数
变换,并且未使用联合立体声编码,实验数据为 SQAM[6]
Sound&&Quality
Assessment&&Material&&–用于主观测试的音乐库中多种类型的音频信号,采样率
44.1KHz,字长 16bit。
上表给出各种算法压缩比和平均比特数的比较,表中第1列是SQAM中各 个曲目的名称,第2,3,4,5列分别列出了测试曲目经过APE,Shorten,LTAC 和本文提出的算法压缩后的压缩比,第6,7,8,9列分别给出该曲目经过APE Shorten,LTAC和本文提出的算法压缩后的平均比特数。
上表 各种算法压缩比和平均比特数的比较:
样值平均比特数比特
由上表可以看到,虽然比起最流行的 APE 格式的压缩率稍微有一些差
距,总体上本算法对于各种音频信号均有较好的压缩效果,特别是对于乐器音频Track08,Track43中的部分音频曲目的压缩率甚至超过了 APE,它揭示
了基于变换的无损音频压缩方案在技术上的优势。
6& && && & 总结和展望 6.1& && &&&研究工作总结 本论文对整数变换特别是整数MDCT 变换进行了深入研究,并将之用于无损音频压缩,取得了良好的压缩效果。总结本论文的工作,包括以下几个方面:第一,论文证明了MDCT 分解为GivenS 旋转和DCT 的推导过程,在此基础上使用两种提升方案一一“经典提升”和“多维提升”实现IntMDCT 。同时论文对hitMDCT 中复杂的矩阵运算提出了相应简化算法,降低了算法实现的复杂度。
第二,本文对变换后的系数进行了映射处理,并在大量统计分析的基础上,发现经过映射后的IntMDCT 系数的概率分布接近于几何分布,因此算法中采用了Golomb 一Rice 嫡编码技术,并且达到较好的编码性能。由于不同频段内变换系数的幅度差异,本论文对于不同频段的变换系数采用了不同的Golomb - Rice 编码参数以得到最优的压缩效率。
第三,本文提出并实现了一种新的无损音频编解码算法,设计了适合于该无损音频压缩算法的比特流结构,实现音频数据的有效编码。分析了采用两种提升实现IntMDCT 相对于浮点变换结果的逼近误差,以及对于整个算法压缩性能的影响。
第四,论文对本算法的压缩效率、鲁棒性和复杂度等性能进行分析,并与现有无损算法相比较。本算法对于各种音频信号均有较好的压缩效果,特别是对于乐器音频的压缩甚至超过了APE 。
6.2& && &&&进一步工作的展望 本文的工作在以下方面还有待完善:
第一,& && && && &&&对于整数MDCT 可以进一步深入研究,如,研究MDCT 的块长的选择机制,窗函数(窗的形状,窗的大小)的切换准则
第二,& && && && &&&对于本文提出的无损音频编码算法进一步研究,如考虑不同的嫡编码方法或者使用混合的嫡编码方法,并为之确定切换准则。
第三,& && && && &&&对于本文提出的无损音频解码算法进一步研究,通过程序优化,进一步降低各个模块的运算复杂度,并与现有算法的解码程序的复杂度进行比较,说明其解码时间上的优势。
第四,& && && && &&&考虑自适应神经网络在无损压缩中的应用,必将进一步推动无损音频压缩的发展和广泛应用。
7& && && & 致谢 首先,衷心感谢我的导师。本论文的全部工作都是在您的精心指导下进行的。与您的接触中,他的卓越的学术水平、科学的思维方式、严谨的治学态度和勤奋的工作精神给我留下了极深刻的印象,使我知道了要成为一名优秀的研究人员所应具备的素质,也为我树立了今后奋斗的榜样。在三年的研究生生活中,您自始至终都给予了我无微不至的关怀,热情、耐心的指导和鼓励,使我受益匪浅,本论文的顺利完成与这些因素是分不开的。您的谆谆教导和鼓励,我一直铭记在心,它们随时都激励、鞭策着我,使我不畏艰难、努力工作,这对我将来的发展是大有益处的。在此,我向您再一次表示感谢!
同时感谢徐盛副教授,给予了我许多诚恳而无私的指导和帮助。感谢教研室的李老师和相关课题的同学,他们在工作中给予了我许多有益的指导和帮助。
感谢实验室其他的老师和同学为我创造了良好的科研氛围和愉快的生活环境。对以上的老师和同学致以真诚的谢意。
最后,衷心感谢我亲爱的父母,他们在生活和学业上给了我无私的关怀与鼓励,感谢他们在我成长道路上所付出的心血。此时此刻,我惟有希望此文能够稍微回报他们无比的关心和爱护!
8& && && &&&参考文献 [1]& & [2] A.Wegener, “MUSICompress: Lossless, low-MIPS audio compression in software and hardware,” in Proc. Int, Conf. Signal Processing Applications and,Technology, 1997, Availabel:/sndspace[3] A.Bruekers, A.Oomen, and R.van der Vleuten, “Lossless coding for DVD audio,” in Proc. 101st AES Conv.,Los Angeles, CA, Nov. 1996, prprint 4358
[4]  Se Yil Park, Se Hyoung Park, Dae Sik Lim and Jaeho ShinA Lossless and Lossy Audio Compression&&using&&Prediction&&Model&&and&&Wavelet&&Transform,The&&2002&&International Technical Conference On Circuits/Systems, Computes and Communications
[5] Tilman liebchen& &Marcus Purat& &and Peter NollImproved Lossless Transform Coding of
 Audio Signals,In: Impulse und Antworten - Festschrift für Manfred Krause, issenschaft & Technik Verlag, Berlin, 1999
[6] Sweldens.&&W.&&The&&lifting&&scheme:&&A&&construction&&of&&second&&generation&&wavelets.&&IMI Technical Report 1995, 06, Industrial Mathematics Initiative, Department of Mathematics, University of South Carolina, 1995
[7] INGRID& &DAUBECHIES& &AND& &WIM& &SWELDENS&& FACTORING& &WAVELET TRANSFORM INTO LIFING STEPS,J. Fourier Analysis and Applications, 4(3):247-269,1998
[8]  W. H. Chen, C. H. Smith, and S. C. Fralick, “A fast computational algorithm for the discrete cosine transform,” IEEE Trans. Commun, vol. COM-25, pp. , 1977[9] “Reconsideration of ‘A fast computational algorithm for the discrete cosine transform.’”, IEEE Trans, Commun., vol. COM-31, pp. 121-123, 1983[10]& &Z.&&Wang,&&“Fast&&algorithms&&for&&the&&discrete&&w&&transform&&and&&for&&the&&discrete&&fourier transform,” IEEE Trans. ASSP, vol. ASSP-32, no. 4, pp. 803-816, 1984[11]& &Ralf&&Geiger,&&Yoshikazu&&Yokotani,&&Gerald&&Schuller,&&Jurgen&&Herre,&&“Improved&&integer transforms&&using&&mutli-dimensional&&lifting”,&&Acoustics,&&Speech,&&and&&Signal&&Processing, 2004. Proceedings. (ICASSP '04). IEEE International Conference on, Volume 2,& &17-21May 2004 Page(s):ii - 1005-8 vol.2
[12]&&Ralf Geiger, Jurgen Herre, Jurgen Koller, karlheinz BrandenburgINTMDCT,A LINK BETWEEN PERCEPTUAL AND LOSSLESS AUDIO CODING,Acoustics, Speech, and Signal Processing, 2002. Proceedings.(ICASSP ‘02). IEEE International Conference on, Volume: 2, 2002,Pages:
[13]& &Peter&&FenwickPunctured&&Elias&&Codes&&for&&variable-length&&coding&&of&&the&&integersTechnical Report 137 ISSN
December 5, 1996
[14]& &R. Geiger, Y. Yokotani, and G. Schuller, “Improved integer transforms for lossless audio coding”, Proc. of the Asilomar Conf. on Signals, Systems, and Computers, 2003[15]& &R. Geiger, T.&&Sporer, J.&&Koller,&&and&&K.&&Brandenburg,&&“Audio&&coding&&based&&on&&integer transforms,” in 111th AES Convention, New York, 2001
[16]& &Mat Hans and Ronald W. Schafer, “Lossless Compression of digital audio ”, IEEE SIGNAL PROCESSING MAGAZINE,JULY 2001
[17]&&Golomb S, “Run-length encodings”, Information Theroy, IEEE Transactions on Volume 12, Issue 3, Jul 1966,Pages:399-401[18]& &Sound Quality Assessment Material – Recordings for subjective Tests. Technical Centre of the European Broading Union(EBU) , 1988
[19]&&Tilman liebchen& &Marcus Purat& &and Peter NollImproved Lossless Transform Coding of
 Audio Signals,In: Impulse und Antworten - Festschrift für Manfred Krause, Wissenschaft & Technik Verlag, Berlin,1999
[20]& &ISO/IEC International Standard IS 11172-3. Information Technology-Coding of  Moving Pictures and Associated Audio for Digital Storage Media at up to About 1.5Mbit/s-Part 3:Audio, 1992[21]& &Lin Xiao, Tan Wee Hong, Gee Chein Woei, Li Gang, “A Lossless Audio CompressionSoftware for Windows Application”, Signal Processing Proceedings, 1998, ICSP’98 1998Fourth International Conference on Volume 2, 12-16 Oct. 1998 Pages:
vol.2Digital Object Identifier 10.1109 COSP.
[22]& &Liebchen, T., Reznik, Y.A..,MPEG-4 ALS: an emerging standard for lossless audio coding. Data Compression Conference, 2004, Proceedings(DCC’04). March: 439 – 448.[23] M. Hans and R.W. Schafer, “AudioPak—An integer arithmetic lossless audio coedec,” inProc. Data Compression Conf, Snowbird, UT, 1998, p.550[24] Tony Robinson: “SHORTEN:Simple lossless and near-lossless waveform&&compression” Technical,report,CUED/F-INFENG/TR.156,,Cambridge,University,Engineering Department, Trumpington Street, Cambridge, CB2 1PZ, UK, December 1994
[25] Tilman liebchen&&Marcus Purat&&and Peter NollImproved Lossless Transform Coding of Audio&&Signals,In:&&Impulse&&und&&Antworten&&-&&Festschrift&&für& &Manfred&&Krause, Wissenschaft & Technik Verlag, Berlin,1999
[26] ISO/IEC JTC1/SC29/WG1 (1997). JPEG_LS:emerging lossless/near-lossless compression stansard for continuous-tone images JPEG Lossless[27] P. Craven, M.Law, and J.Stuart, “Lossless compression using IIR prediction filters,” inProc. 102nd AES Conv, Munich, Germany, 1997, preprint 4415[28] P. Craven, M. Gerzon, “Lossless coding for audio discs,” J. Audio Eng. Soc, vol. 44, no.9, , 706-720, 1996[29] D.Lee, Personal communications on waveform archiver, Aug. 1997[30] C. Montgomery, Personal communication on OggSquish, Aug 1997 [31] R. Sprague, Private communication on Sonarc, Aug. 1997. [32] [33] [34] A. Bruekers, A. Oomen, and R. van der Vleuten, “Lossless coding for DVD audio,” inProc. 101st AES Conv., Los Angeles, CA, Nov. 1996,preprint 4358.[35] C. Cellier, P. Chenes, and M. Rossi, “Lossless audio data compression for real time applications,” in Proc. 95th AES Conv., New York, 1993, preprint 3780.[36] M. Hans, “Optimization of digital audio for Internet transmission,” Ph.D. dissertation, School Elect. Comp. Eng., Georgia Inst. Technol., Atlanta, 1998.[37] D. Wu, E.C.Tan. “Comparison of lossless image compression algorithms”, 1999 IEEE Tencon: 718-721[38] Howard, P.G; Vitter, J.S ,“Arithmetic coding for data compression”, Proceedings of the
IEEE Volume 82, Issue 6, June 1994 Page(s):857 – 865[39] Yu R, Ko C C, Rahardja S, Lin X. “Bit- plane Golomb Coding for Sources with Laplacian
Distributions”. Acoustics&&Speech&&and Signal Processing&&Proceedings. (ICASSP'03). 2003
IEEE International Conference 7- 280.
[40] 胡航编著,语音信号处理修订版哈尔滨工业大学出版社
[41] 张晓玲,图像无损压缩算法初步研究,北京工业大学硕士学位论文,2001.5
9& && && & 英文缩写说明
DCT,Discrete Cosine Transform 离散余弦变换MDCT,Modified Discrete Cosine Transform 改进型离散余弦变换IntMDCT,Integer Modified Discrete Cosine Transform 整数改进型离散余弦变换LPC,Linear Prediction Coding 线性预测编码CRC,Cyclic Redundancy Check 循环冗余校验SQAM,Sound Quality Assessment Material 用于主观测试的音乐库
10& && & 附录
实现 CRC 校验所采用的表格
crc_table [256] ={0x5, 0x800f, 0x000a, 0x801b, 0x001e, 0x1,0x6, 0x003c, 0x8, 0x802d, 0x2,0x6, 0x006c, 0x8, 0x807d, 0x2,0x5, 0x805f, 0x005a, 0x804b, 0x004e, 0x1,0x80c3, 0x00c6, 0x00cc, 0x80c9, 0x00d8, 0x80dd, 0x80d7, 0x00d2,0x00f0, 0x80f5, 0x80ff, 0x00fa, 0x80eb, 0x00ee, 0x00e4, 0x80e1,0x00a0, 0x80a5, 0x80af, 0x00aa, 0x80bb, 0x00be, 0x00b4, 0x80b1,0x6, 0x009c, 0x8, 0x808d, 0x2,0x6, 0x018c, 0x8, 0x819d, 0x2,0x01b0, 0x81b5, 0x81bf, 0x01ba, 0x81ab, 0x01ae, 0x01a4, 0x81a1,0x01e0, 0x81e5, 0x81ef, 0x01ea, 0x81fb, 0x01fe, 0x01f4, 0x81f1,0x81d3, 0x01d6, 0x01dc, 0x81d9, 0x01c8, 0x81cd, 0x81c7, 0x01c2,0x5, 0x814f, 0x014a, 0x815b, 0x015e, 0x1,0x6, 0x017c, 0x8, 0x816d, 0x2,0x6, 0x012c, 0x8, 0x813d, 0x2,0x5, 0x811f, 0x011a, 0x810b, 0x010e, 0x1,0x6, 0x030c, 0x8, 0x831d, 0x2,0x5, 0x833f, 0x033a, 0x832b, 0x032e, 0x1,0x5, 0x836f, 0x036a, 0x837b, 0x037e, 0x1,0x6, 0x035c, 0x8, 0x834d, 0x2,0x03c0, 0x83c5, 0x83cf, 0x03ca, 0x83db, 0x03de, 0x03d4, 0x83d1,0x83f3, 0x03f6, 0x03fc, 0x83f9, 0x03e8, 0x83ed, 0x83e7, 0x03e2,0x83a3, 0x03a6, 0x03ac, 0x83a9, 0x03b8, 0x83bd, 0x83b7, 0x03b2,0x5, 0x839f, 0x039a, 0x838b, 0x038e, 0x1,0x5, 0x828f, 0x028a, 0x829b, 0x029e, 0x1,0x82b3, 0x02b6, 0x02bc, 0x82b9, 0x02a8, 0x82ad, 0x82a7, 0x02a2,0x82e3, 0x02e6, 0x02ec, 0x82e9, 0x02f8, 0x82fd, 0x82f7, 0x02f2,0x02d0, 0x82d5, 0x82df, 0x02da, 0x82cb, 0x02ce, 0x02c4, 0x82c1,0x6, 0x024c, 0x8, 0x825d, 0x2,0x5, 0x827f, 0x027a, 0x826b, 0x026e, 0x1,0x5, 0x822f, 0x022a, 0x823b, 0x023e, 0x1,
0x6, 0x021c, 0x8, 0x820d, 0x2

我要回帖

更多关于 hpv高危阳性怎么治疗 的文章

 

随机推荐