SOGO論壇

標題: [技術文章]邁進高傳真多聲道音效技術探究 [列印本頁]

作者: 紅塵孤鳥 時間: 2006-12-10 14:04:12 標題: [技術文章]邁進高傳真多聲道音效技術探究

從1958年出現立體聲系統時，利用左右聲道不同，使得橫向聲音具備了基本的方向性與空間感，讓人類的聽覺感受得到大幅的提升，從此之後，不論是電視或者是黑膠片唱盤以及後來的錄音帶以及CD唱片等等，無不以立體聲為主要賣點，迅速普及於消費市場中。

但是立體聲環境還是有其極限存在，因為立體聲音源的定位與使用者與喇叭之間的相對位置關係甚大，如果使用者稍微偏離了音效預設的平衡點，那麼所得到的聽覺感受將會大打折扣。因此就有業者提出多聲道系統，自1991年起於電影院環境中首先採用，這些多聲道系統裡，除了基本的左右聲道以外，還另外加入了左右環繞聲道、中央聲道以及1個額外的超重低音聲道，藉以營造出更全方位的真實聽覺感受。

音效編碼技術的演進

■聲音的數位化

一般來說，聲音是由一連串由震動體及介質的交互作用所產生的波動而來。以我們平時最常遇到的語音為例，人類所具有的聲帶本身就是一個非常複雜的發聲機制，而傳遞語音所必須要的介質就是存在於我們四周的空氣。聲帶周期性振動造成的長程相關性與音波在聲道共振造成的短程相關性，可充分運用於消除語音中所含的多餘訊息，因此這也成了後來語音以及相關聲音壓縮技術的衍生基礎。

如果要將聲音作為數位錄音，我們首先要使用麥克風將空氣壓力變化轉換成電子信號，再經類比/數位轉換成0與1位元形態的資料來儲存。轉換過程有取樣、量化、及脈衝編碼調變3個步驟。取樣是讀取聲音訊號在相等時間間隔的瞬間值；量化是將各個取樣瞬間值的振幅以有限的數值表示；而脈衝編碼調變則是將量化後的數值用2進位數的符碼表示。

影響數位錄音品質的兩個主要因素為取樣頻率與量化過程的解析度，量化所用的位元數目決定其解析度，而取樣率的下限則是該聲音所包含最高頻率的兩倍。例如，電話語音頻寬為200?3,200Hz，交響樂的頻寬則為40?20,000Hz，因此電話語音與音樂光碟的取樣率分別為8,000Hz與44,100Hz。傳統的有線電話與音樂光碟都是利用這種脈衝編碼調變技術來進行數位化，因此需要極大的儲存空間及傳輸頻寬。舉例而言，目前音樂光碟所採用的量化解析度為16位元，則其立體雙聲道的位元率為每秒1411200位元組（44100*16*2），因此12分鐘的音樂大約需要10億位元的儲存空間。為了配合HDTV與多媒體通訊發展的需求，各式各樣的數位語音與音效編碼技術也不斷地研發進步中。

■音效編碼的實作

音效編碼的目的，是為了將聲音資料進行壓縮，以節省傳輸時所需的頻寬以及在記憶體中所占的儲存空間，同時需保證解碼端在還原後還能聽到和原來相差無幾的聲音。理想的音效編碼機制，除了可以利用訊號取樣點之間的相關性來移除多餘的訊息以外，並且也要能夠從聲音心理學來加入人耳對於聲音感受的影響，從中刪除許多不為人耳所辨識的聲音資訊，藉以在不影響人類聽覺感受的前提下，取得更大的壓縮比。

■音效編碼技術的發展

以目前市場上的音樂儲存媒體主流來說，常見的光碟片仍是採用脈衝調變編碼的錄音格式，雖然音質相當出色，人耳不易分辨出有減損的狀況，但是在儲存上顯得非常沒有效率。因此自從1992年起，國際標準組織（ISO）便制訂了一系列的影音編碼標準，藉以處理相關視訊與音效的編碼處理。MPEG-1是第一個針對音效壓縮制訂的標準，總共可支援3種取樣率，而依照其複雜度，共可分為layer 1、layer 2以及layer 3，壓縮率分別為4分之1、8分之1以及12分之1。

MPEG-1中的3個layer的轉換技術都是以32個次頻帶的多向濾波器組為其技術基礎。相較於layer 1高位元率，layer 2採用傅立葉轉換來提供較高解析度的遮蔽臨界曲線計算，並且降低相鄰資料區域的多於訊息，以達到中低位元率應用的需求。而layer 3則是將每個次頻帶訊號再做修正餘弦轉換，藉由去除頻域係數之間的相關性，來大幅提高壓縮率。事實上，MPEG-1 layer 3也是目前最為風行的格式，而以該格式壓縮的音樂檔案就稱為MP3檔案，因為此格式的興起，加上唱片業在行銷理念上的故步自封，以及音樂製作品質上的缺乏控管，便理所當然的造成了整個唱片產業的衝擊，

MP3（MEPG-1 Layer 3）的興起雖然帶起了風潮，但是基於其編碼規則的播放器卻是需要支付授權費的，因此也有諸如OGG等格式的興起，該格式完全開放而且免費，且因為其壓縮過程應用了更為高階的聲學模型，壓縮品質要比相同位元率下的MP3格式來得高。但是MP3流行的早，支援的設備也多，因此OGG只能居於二線。類似狀況的還有WMA以及AAC等音效壓縮格式，WMA的壓縮品質與MP3相差不多，在低位元率的表現上比起MP3稍好，但高位元率壓縮品質卻不見得更優秀，因此WMA相當適合用於網路串流傳輸之用。

至於AAC，則是由Fraunhofer IIS、Dolby、蘋果電腦、AT＆T以及SONY等公司聯合開發，基於MPEG-2的壓縮技術，原本是定位為取代MP3格式之用，作為聲音壓縮技術，其壓縮比高達18：1至20：1，可以說遠勝MP3，後期整合MPEG-4標準之後，音質表現更是突出，但是從1997年出現之今，支援的音樂播放設備相當少，除了SONY自家的MP3播放器以外，就以iPod支援的最為完整，其他廠商的支援並不踴躍。而以上介紹的都是屬於有損音效壓縮格式，意思即是依照其壓縮編碼規則的不同，都有程度不等的捨棄部分聲音細節的情況。

多聲道編碼技術的現身與發展

目前最為風行的兩大多聲道編碼標準，便是Dolby Digital以及DTS兩大陣營，在光學儲存媒體邁入藍光世代之後，兩者也都跟隨這潮流推出了高音質多聲道標準，但是技術的發展有其軌跡，我們就分別針對這兩大多聲道標準來進行介紹：

■Dolby labs

杜比一開始是以發展聲音減噪技術起家的，該技術被稱為Dolby NR（noise reduction），可分為Type A/B/C/S這四種，被應用於當時相當普及的錄音帶以及FM收音設備中，雖然其原理是藉由遮蔽特定的高頻以及低頻訊號，來降低雜音的音量，以取得較佳的音質表現，但是也因此會損失了不少細節。

隨後杜比也發展出杜比環繞技術（Dolby Surround），這項技術包含了3個聲道，分別是2個前置以及1個後方聲道，算是多聲道的鼻祖。不久杜比環繞技術的延伸規格—杜比專業定向邏輯（Dolby Pro Logic）則擴充為4個聲道，分別是前置左右聲道、中央聲道，以及由2個喇叭共享的後方聲道。而在1990年代，該公司正式推出了Dolby Digital 5.1技術，該技術也稱為杜比AC-3（Audio code-3），此技術包含了6個聲道，包含了前置左右、後方左右、1個中央聲道以及1個獨立的重低音聲道。5.1中的5代表了5個定位聲道，.1則是重低音LFE（Low Frequency Effects）聲道。

杜比AC-3採用的壓縮方式為固定比例（Constant Bit Rate，CBR）的音效壓縮，比率約為1：2，換言之，無論聲音原先的樣本數有多大，壓縮比都是維持一定的比例，此種壓縮方式有其優缺點，優點是佔用的空間可以減少，但缺點是聲音品質會隨著音量的放大而降低，細微處的減損會相當明顯。一般來說，AC-3的聲音壓縮都是採用18-bit編碼，因此AC-3音效的標準輸出流量為384kbps（6聲道 x 18 x 48KHz），以目前的眼光來看，除了多聲道的支援以外，即使是後期可以將流量擴增為640kbps，在音質的表現上，仍可以說比MP3還要不如。杜比AC-3包含了許多延伸的技術，比如說虛擬杜比數位（Virtual Dolby Digital）技術的音效系統。便是利用混音的處理，從前置喇叭發出虛擬的中央聲道，後方聲道則由使用HRTF演算法的處理器模擬出對應的效果，再透過前置喇叭發聲。藉此達到以3支喇叭（2個前置聲道加上1個重低音聲道）虛擬出多聲道的聽覺感受。不過HRTF技術對於使用者的相對位置非常講究，如果使用者沒有處在最佳的聲音位置上，那麼多聲道的模擬效果就會大打折扣了。

其後也有推出針對更多聲道的Dolby Digital Ex技術，最高可支援高達8的聲道，包含了7個定位聲道以及1個重低音聲道。基本上Dolby Digital Ex只是在原有的5.1聲道基礎上，多加了1到2個聲道，藉由不同聲道數量的組合，來組成如6.1及7.1聲道的聲音系統。不過這個技術並不能真正提供超出5.1聲道的聲音軌道，因此多出來的聲道都是計算出來的，無法做到如競爭對手DTS-ES般的真正6.1聲道系統。

隨著藍光儲存媒體的浮現，杜比也推出了相對應的多聲道技術，此技術定名為Dolby Digital Plus，基本上也還是原有AC-3編碼的延伸，只不過流量被大幅擴充至6.144Mbps（普通7.1聲道約為3Mbps），且支援了高達14個聲道（13.1）的系統架設。不過高聲道數有其應用限制，目前也見不到其必要性，因此主要推行著力點還是在於其高流量所帶來的音質改善。不過杜比也定義了一個新的無損音效多聲道標準，此標準命名為Dolby True-HD。

Dolby True-HD與Dolby Digital Plus同樣可支援到高達13.1的聲道輸出，不過在編碼方式的改進才是其重頭戲，由於支援了Meridian Lossless Packing技術（MLP技術，也稱為LPCM）。此技術是由Meridian Audio公司所發展，基本上MLP技術並不是什麼新玩意，早從標準DVD-Audio音效標準中，便定義了此種壓縮格式，許多只提供2聲道的高音質DVD影片也都採用此技術進行聲音編碼，音質表現比起傳統的AC-3格式高出不少，且幾乎所有的DVD播放裝置都支援了MLP格式。

那或許讀者會有疑問，為何不在DVD時代就採用此編碼技術來推出多聲道系統？首先，我們必須要考慮到，標準的DVD傳輸流量並不高，因此若5.1聲道採用此種格式壓縮，2聲道LPCM流量通常為1.5Mbps，6聲道可能要高達4.5Mbps，加上影片本身所需的流量，一般DVD播放裝置上可能就無法使用，其次，雖然DVD容量是傳統CD的6、7倍以上，但是MPEG-2視訊壓縮格式也會用去更大的流量以及儲存空間，加上音效所需的儲存空間，更是顯得捉襟見肘。因此，到藍光世代才提出無損多聲道格式，也是著眼於藍光規格動輒2、30GB以上的儲存容量，在儲存空間上較無限制的緣故。

由於Dolby Digital技術出現較早，且被採用為國際標準，因此不論在電影院或者是多媒體影音光碟、電視聲音訊號中，都可見到其被大量應用的範例，雖然早期有著音效品質較差的缺點，但是在進入藍光世代之後，隨著藍光媒體的高儲存容量以及HDMI的高流量支援，並藉由改善編碼規則達到真正原音重現的能力。

■DTS（Digitial Theater System）

DTS是在1993年1月由DTS公司所開發成功的1種多聲道編解碼技術，在當年6月便被大導演史蒂芬史匹伯的經典名片侏羅紀公園所採用，當時藉由此多聲道技術所傳達出來的聲音細節，震撼了無數觀影人的耳朵。

DTS與Dolby Digital的技術非常相似，DTS同樣也是採用有損壓縮的數位編解碼技術，將5.1聲道壓縮成1條數位聲音串流，記錄到儲存媒體上，播放時才由設備進行解壓縮，還原為各自獨立的5.1（或6.1、7.1）聲道音效訊號。

DTS公司推出了多種聲場技術，其中DTS Digital Surround是最廣為流傳的一種，屬於5.1聲道系統，人們通常說的DTS技術，或者DTS環繞，一般就是指DTS Digital Surround。DTS採用CAC（Coherent Acoustics Coding，相干聲學編碼）方式工作，和Dolby Digital一樣也屬於利用心理聲學原理來對聲軌進行編碼的有損數位壓縮技術。在電影院中，DTS的音軌錄音採取了特殊的聲音畫面分離的數位身歷聲，數位音軌燒錄在光碟上，由專用的光碟機讀取，另外在拷貝的類比音軌與影片畫格之間紀錄有時間同步碼，用來控制光碟機播音與畫面的同步。

由於DTS講究音質表現，因此在儲存空間上的需求較大，這主要是因為其編碼架構的不同，首先，DTS採用24-bit編碼，比起AC-3只用18-bit，在動態範圍上就廣了許多。而取樣頻率方面也高達96KHz，為AC-3的2倍，不過平均壓縮比約為1：3，因此比起AC-3要佔用更大的儲存空間。而DTS採用的是VBR（Variable bit rate）動態壓縮技術，會隨著聲音資料的多寡來調整壓縮比，而這些壓縮比介於1：1到1：40之間，已平均資料速率來說，每秒1.5Mbps的傳輸流量，為一般AC-3編碼的3到5倍，因此聲音的品質要比AC-3高出不少，不僅是整體音場的動態範圍，在高音與低頻的量感更是AC-3所不能及的。

不過由於DTS所需要的儲存空間較大，同常採用DTS技術的DVD影片，只會儲存單一DTS聲軌，或是搭配另一個AC-3聲軌，而不能如同AC-3可以讓DVD影片同時容納多個多聲道聲軌，同時也會壓縮到其他附加內容的儲存空間，因此採用DTS聲軌的DVD影片通常也都只有正片內容，而缺少諸如幕後花絮、多種結局等內容。不過由於DTS是屬於選配規格，並不是所有的影片都會採用此種音效規格，因此大部分都是針對具有高傳真音效需求的影音玩家市場，而不是針對一般家庭。

在進入藍光世代之後，DTS同樣也推出了自家的無損多聲道音效格式，更為DTS-HD，DTS-HD具有格式升級能力、資料串流傳輸廣泛的前後相容性、可移植性以及可加密性。理論上DTS-HD可以支援無線數量的獨立環繞聲道，並且也具備有向下混音至5.1甚至是2.1聲道的能力。HTS-HD是1種具有高品質低碼率（Low Bit-Rate，LBR）的聲音壓縮技術，採用的也是DTS最引以為傲的核心技術Coherent Acoustics技術，在128Kbps時即可具備有CD音質表現，也可進行低於64Kbps的聲音編碼，並且可以進行動態自我調整，以利於網路傳輸，因此在編碼靈活性以及音質表現上，可以輕易取得平衡。

DTS-HD另外一個優勢就是只要擴大機支援DTS解碼，利用Set-Top-Box內建的轉碼功能，將高流量的DTS-HD串流轉換為標準的1.5MBps流量音軌，即可被現有支援DTS解碼的擴大機還原為正確的聲道與聲音表現。

結論

雖然在DVD世代，兩大多聲道編碼標準有其各自不同取向，因而形成了不同的市場定位，但是在進入藍光世代之後，兩者之間的差距有縮小的傾向。Dolby技術由於是標準化，且佔市場大宗，因此在競爭上也顯得較具優勢，而在DTS這方面，可以利用舊有的擴大機進行DTS-HD的解碼，則是其優點之一，雖然如此一來DTS-HD的最大優勢—音質，將不復存，但考慮到過去的硬體設備投資仍可存續其價值，對於已經有不錯硬體設備的消費者，也會是個相當大的誘因。

作者: scattie 時間: 2006-12-10 15:17:43

很不錯的資料,非常實用，感謝分享.

作者: ppacce 時間: 2006-12-11 17:14:20

這讓我對聲音技術的演進與發展,更有概念了,受惠良多。

作者: cupidchen 時間: 2007-12-30 23:49:19

聽君一席話,勝讀十年書...佩服佩服

歡迎光臨 SOGO論壇 (https://oursogo.com/)