定義
AAC,全稱Advanced Audio Coding,是一種專為聲音數據設計的文件壓縮格式。與MP3不同,它采用了全新的算法進行編碼,更加高效,具有更高的“性價比”。利用AAC格式,可使人感覺聲音質量沒有明顯降低的前提下,更加小巧。蘋果ipod、諾基亞手機支持AAC格式的音頻文件。
優點:相較于mp3,AAC格式的音質更佳,文件更小。
不足:AAC屬于有損壓縮的格式,與時下流行的APE、FLAC等無損格式相比音質存在“本質上”的差距。加之,傳輸速度更快的USB3.0和16G以上大容量MP3正在加速普及,也使得AAC頭上“小巧”的光環不複存在。
特點
①提升的壓縮率:可以以更小的文件大小獲得更高的音質;
②支持多聲道:可提供最多48個全音域聲道;
③更高的解析度:最高支持96KHz的采樣頻率;
④提升的解碼效率:解碼播放所占的資源更少;
杜比實驗室的結論
①128Kbps的AAC立體聲音樂被專家認為不易察覺到與原來未壓縮音源的區别;
②AAC格式在96Kbps碼率的表現超過了128Kbps的MP3格式;
③同樣是128Kbps,AAC格式的音質明顯好于MP3;
④AAC是唯一一個,能夠在所有的EBU試聽測試項目的獲得“優秀”的網絡廣播格式。
總的來講,AAC可以說是極為全面的編碼方式,一方面,多聲道和高采樣率的特點使得它非常适合DVD-Audio;另一方面,低碼率下的高音質則使它也适合移動通訊、網絡電話、在線廣播等領域,真是全能的編碼方式。
背景介紹
AAC瑞聲聲學科技股份有限公司
早在1987年,Fraunhofer IIS就開始了“EUREKA project EU147, Digital Audio Broadcasting(DAB)”的研發,而這就是MP3的前身。通過和迪特爾·塞澤爾(Dieter Seitzer)教授的合作,他們開發出了著名的ISO-MPEG Audio Layer-3壓縮算法。1993年這個算法被整合到MPEG-1标準中,從此MP3被投入使用。
1996年底Fraunhofer IIS在美國獲得MP3的專利,并在1998年對外聲明将收取MP3的專利使用費。而從1999年初開始,MP3格式廣泛流行起來。特别是出現了很多免費提供MP3的音樂網站,MP3随身聽也像洪水般湧進市場,種種因素促使MP3成為了極其主流的音頻格式。盡管之後有VQF、WMA等挑戰者,但MP3牢固的根基使它至今仍穩穩地坐在老大的位置上。
随着時間的推移,MP3越來越不能滿足需要了,比如壓縮率落後于Ogg、WMA、VQF等格式,音質也不夠理想(尤其是低碼率下),僅有兩個聲道……于是FraunhoferIIS與AT&T、索尼、杜比、諾基亞等公司展開合作,共同開發出了被譽為“21世紀的數據壓縮方式”的Advanced Audio Coding(簡稱AAC)音頻格式,以取代MP3的位置。
其實AAC的算法在1997年就完成了,當時被稱為MPEG-2 AAC,因為還是把它作為MPEG-2(MP2)标準的延伸。但是随着MPEG-4(MP4)音頻标準在2000年成型,MPEG-2AAC也被作為它的編碼技術核心,同時追加了一些新的編碼特性,所以我們又叫MPEG-4 AAC(M4A)。
設備支持
蘋果
蘋果公司重量級的iPod和iPod mini全都能播放16-320Kbps的AAC文件,加上蘋果傾力打造的iTunes音樂播放器,為制作播放AAC文件鋪好了一條捷徑。
諾基亞
諾基亞
諾基亞則在手機領域推廣AAC格式,包括主打音樂的Xpress Music系列如5320XM、萬衆矚目的N-Gage、3G網絡的7600、媒體手機7700、時尚娛樂的3300、新登場的6230和可作手機附件的音樂播放器HDR-1,它們都可以播放儲存在MMC卡上的AAC文件。
其他産品
此外還有一些廠商的産品支持AAC,像音視頻開發的Anychat、Daisy Multimedia的閃存随身聽DIVA GEM,康柏支持SM卡擴展的iPAQ PA-1,東芝的SD卡随身聽MEA210,愛華的MM-EX300閃存随身聽,索尼的Walkman和PSP,松下的e-wear SD Audio Players還有采用DataPlay為存儲介質的艾利和IDP-100等等。
Apple和Real公司還開設了網上音樂商店,将最新的唱片壓縮成AAC格式提供下載。
特性
與MP3的關鍵不同
AAC是在MP3基礎上開發出來的,所以兩者的編碼系統有一些相同之處。但是對比一下兩者的編碼流程圖,會發現AAC的編碼工序更為複雜。
①濾波器組(Filter bank):主要完成信号的時頻轉換。從而得到頻域的頻譜系數。
②時域噪音修整(Temporal Noise Shaping,TNS):這項神奇的技術可以通過在頻率域上的預測,來修整時域上的量化噪音的分布。在一些特殊的語音和劇烈變化信号的量化上,TNS技術對音質的提高貢獻巨大!
③預測(Prediction):對音頻信号進行預測可以減少重複冗餘信号的處理,提高效率。
④量化(Quantization):AAC的量化過程是使用兩個巢狀循環進行反複運算。通過對量化分析的良好控制,比特率能夠被更高效地利用。
⑤比特流格式(Bit-stream format):在AAC中,信息的傳輸都要經過熵編碼,以保證冗餘盡可能少。此外AAC擁有一個彈性的比特流結構,使得編碼效率進一步提高。
⑥長時期預測(Long Term Prediction,LTP):這是一個MPEG-4 AAC中才有的工具,它用來減少連續兩個編碼音框之間的信号冗餘,對于處理低碼率的語音非常有效。
⑦知覺噪音代替(Perceptual Noise Substitution,PNS):這也是MPEG-4 AAC中才有的工具,當編碼器發現類似噪音的信号時,并不對其進行量化,而是作個标記就忽略過去,當解碼時再還原出來,這樣就提高了效率。
編碼
壓縮算法
作為一種高壓縮比的音頻壓縮算法,AAC通常壓縮比為18:1,也有資料說為20:1,遠勝mp3,而音質由于采用多聲道,和使用低複雜性的描述方式,使其比幾乎所有的傳統編碼方式在同規格的情況下更勝一籌。不過直到2006年,使用這一格式儲存音頻的并不多,可以播放該格式的mp3播放器更是少之又少,前所知僅有蘋果iPod,而手機支持AAC的相對要多一些,此外電腦上很多音頻播放軟件都支持AAC格式,如蘋果iTunes。
運算法則
AAC所采用的運算法則與MP3的運算法則有所不同,AAC通過結合其他的功能來提高編碼效率。AAC的音頻算法在壓縮能力上遠遠超過了以前的一些壓縮算法(比如MP3等)。它還同時支持多達48個音軌、15個低頻音軌、更多種采樣率和比特率、多種語言的兼容能力、更高的解碼效率。号稱「最大能容納48通道的音軌,采樣率達96KHz,并且在320Kbps的數據速率下能為5.1聲道音樂節目提供相當于ITU-R廣播的品質」。
總之,AAC可以在比MP3文件節省大約30%的儲存空間與帶寬的前提下提供更好的音質。但是在空間上和結構上AAC和mp3編碼出來後的風格不太一樣,喜歡與否屬于仁者見仁智者見智的事情。
AAC+
AAC+,也稱HE-AAC。
HE意思是high efficiency(高效性)。HE-AAC混合了AAC與SBR技術。SBR代表的是Spectral Band Replication(頻段複制)。SBR的關鍵是在低碼流下提供全帶寬的編碼而不會産生多餘的信号。傳統認為音頻編碼在低碼流下意味着減少帶寬和降低采樣率(見MP3 FAQ #7)或産生令人不快的噪音信号。
SBR解決問題的方法是讓核心編碼去編碼低頻信号,而SBR解碼器通過分析低頻信号産生高頻信号和一些保留在比特流中的指導信号(通常碼流極低,~2kbps)。 這就是采用無SBR解碼器的原因,這樣你的帶寬(frequency response)(頻率響應)會被嚴重浪費。這也是被叫做Spectral Band Replication的原因,它隻是增加音頻的帶寬,而非重建。



















