マスタリング論 #3 2003年6月1日 宇都宮 泰 ここまで、#1で序論、#2/b/cでコピー技術とその検証についてのべたが、#1はマスタリングの必要性と歴史、#2は「壊さない」技術についてのものと要約できる。 このテキスト・シリーズでは、この#3章で積極的に「壊す」技術について解説するが、それは#2以前で述べられた「壊さない」技術上に立脚したものであり、単なる「音造り」だけでは成立しない。なぜならマスタリングは自由な、作品に関わる技術である以前に「業務」だからである。読者の多くは面倒な検証や理論の学習に消極的で、一刻も早く「音造り」について知りたいだろうが、それは本論の目的に反する。順序よく読破されたい。忘れないでいただきたい。耳に聴こえる、分析可能なあるいは数値化可能な要素は音情報の表層にすぎない。音楽の魅力や情報はその奥に存在する高度でデリケートなエネルギーであることを忘れてはならない。このエネルギーについて文章で著すことなど私にはできないが、そのエネルギーが存在することの自覚が無ければ、「何を壊さずに残す」のか、あるいは「何は壊し変造」してもよいのか識別できないではないか! 3−1)最大情報量を持つもの (後半の序説) マスタリングという技術に於いて、物理的に最大の情報量を持つ存在は「マスター」と呼ばれる、マスタリング・プロセスに持ち込まれる何等かのメディアに格納された音信号である。それがデジタルであろうとアナログであろうと、コピー、レベル調整、フォーマットコンバートなどのあらゆる処理に於いて劣化は生じる。程度の差があるだけだ。まず、この事実を正しく把握すべきである。この事実をもってして必要な、劣化というリスクを犯してまで必要な加工とは何だろう? 想定される理論とは次のようなものである。 「マスター」は確かに最大情報量を持つ「価値」のある存在だが、決して消費サイクルの末端に位置する完結した存在では無い。つまり消費者の再生環境はレコーディングスタジオと比べ、プレーヤ、スピーカ、騒音レベル、室内音響などの物理的性能は言うに及ばず、聴き取りレベルや態度、心理に至るまで「劣って」いるが、その「劣った環境」こそが「価値」の発生する場所であり、完結すべき場所だというのである。 この「劣った環境」に於いて、目的の情報が消費者に最大限伝送されるには、その「劣り具合」を想定し、それに見合った加工を施すことが適切であるとされる。言い方を変え、例えれば騒音レベルの高い環境が想定されるなら、低いレベルの部分は生理現象としてのマスキング効果により聴こえにくくなるが、これに対応するには平均レベルを持ち上げることが有効と予想される。BGMとしての想定があるなら、会話をマスキングしないようピーク成分を抑圧することが有効と考えられる。同様の想定により帯域制限、位相特性、歪み特性等の変造を行い最大情報量を削り落とすことで、新しい目的環境に於ける最大情報量を獲得するとされる。さらに状況を複雑にする要因として、ライバル作品あるいは流行の存在を加味して作業が行われることが挙げられる。 随分と消費者を見下した理論であるが、ポピュラー音楽に於いてこの考え方は決してマスタリングだけではなく、それ以前のスタジオレコーディングに於けるモニタースピーカの使い方にもあらわれている。想定される再生環境(再生に用いられるスピーカ)の平均的物理能力としてY社製NS−10シリーズがマッチするというものである。「大は小を兼ねない」という論理に於いて正論と言えなくもないが、あまりに見下しすぎていないだろうか。この製品は密閉箱16cm2way構成で帯域の連続性ではフルレンジに劣るし、帯域の広さでは今やテレビ受像器に内蔵されるスピーカにも劣る。また低音域では歪みが多い。私の所見ではこの選択は単なる形骸化の一つと考えている。つまり「この選択が有効なポピュラー音楽の分野もある」程度のことと思われる。逆の見方をすれば、この選択はポピュラー音楽の一つの「標準化」の現れととることもできる。 本章の主題から一見外れていそうに思える文脈だが、実はここにマスタリングの本質的問題が現れている。リミッターや各種のフィルター、エフェクターの使用によって加工が成されると考えられがちであるが、その使用の根拠は単なる「使用すること」ではなく、使用することによノなってからコンプレッサの使用頻度は大幅に減少した。) そもそもマスタリング以前にミキシング自体の目的が最適化であり、それはモニターにより大きく変化する。スピーカの品種、あるいはスピーカかヘッドホンか、筆者は結果を聴くだけで何が使用されたかおおよそ判定できる。正しく作業された作品においては、目的とする再生環境が音に表れるものである。 コンプレッサを用いるならば、その効用と意味を知り、検証ができない使用は無意味であることを理解しなければならない。当然、弊害も。 つまり物理的最大情報量を持つ「マスター」を変造するには、実際の再生環境に於いてそのときの最大情報量が得られる形式に於いてのみ許される、という大義があるのだ。・・・・が、多くの作品では忘れ去られているように私は思える。 3−2) ゲイン・リダクション概説 ゲイン・リダクション(Gain Reduction)は総じて下図の機能回路の組合せで成立する。 入力−−−−|−−−−−−−−−−−−VCA−−−−−−−−−出力 |分岐 | |−−信号処理−−制御電圧−| 文によって解説すると、 1 入力された信号はVCA(Voltage Controled Amplifire:電圧制御増幅器・・・・ツマミのかわりに電圧でレベルを上げ下げできるフェーダーのようなもの)に入り、レベル調整後、出力される。 参考)VCAにはトランスコンダクタンスやダイオード等のPN接合の非抵抗特性(非直線部分)の応用、FETのドレイン/ソース間の抵抗値可変特性の利用、cdS(光によって抵抗値が変化する部品)の使用が一般的で、まれに磁気増幅器なども利用される。これらの使用部品の性質は、ある程度結果としての音のキャラクターにも影響を及ぼす。デジタルの製品では一般的に掛け算アルゴリズムが用いられるが、固定小数点処理と浮動小数点処理に分けられ、同様にキャラクターに影響があるようだ。 2 入力された信号は同時に信号処理回路に入り、目的に合わせた処理がなされる。その処理された信号を制御電圧としてVCAへ入力。 ゲイン・リダクションはコンプレッサ、リミッター、エキスパンダー、ゲートの4種に大別できるが、その違いは信号処理回路の違いだけである。(原理の上で) アナログ回路設計技術を習得している者には、この説明で概要が理解できるが、音響オペレータには少し言語や暗黙の了解が違いすぎる。本稿では故意に難解にする意図は無いので、極力判り易い表現を用いたい。それには擬人化が適切であろう。 3−2−a)ゲイン・リダクション擬人化表現 登場人物はゲインの妖精(ホントは小人としたかったが、差別用語だとか・・・) この妖精は入力された信号のレベルをメーターで見ている。そのメーターの指示値に従ってフェーダーを動かしているのだが、その読み方やフェーダーの動かし方によってコンプレッサ、リミッターなどの呼び名がつくのである。 3−2−a−a)コンプレッサ擬人化表現 この妖精のコンプレッサ・モードの動作は次のとおり。 まず、フェーダーの初期値(入力が無い時=メーターが振れてないとき)は最大(または0dB)にセットされている。 信号が入力されメーターが振れ始めると、妖精はそれに反比例するかたちでフェーダーを下げる。(妖精なんて言わなくても、メーターの針がパワフルで、フェーダーを動かせるほどの力があるなら話が早いが。力強いメーターであるペンレコーダーや脳波計の針とフェーダーをメカニカルに組み合わせても、コンプレッサなどのゲインリダクションを作ることはできる。) メーターの振れ方に対してどれくらいフェーダーを動かすかによって結果は異なるが、それをコンプレッサの用語では「圧縮比」または単に「Ratio」と呼ぶ。 結果として出力は入力に比例しなくなり、同時にレベルの分布が変化し、分布にピークが現れる。聴感では音量の変化が少なくなった、「つまった」印象になる。 3−2−a−b)リミッタ擬人化表現 基本的にはコンプレッサのときと同じだが、メーターの一定レベル(閾値:スレッショルド・レベル)以下のところが紙を貼って隠してあり、入力がそのレベル以下のとき妖精はメーターの針を見ることができない。 そのレベルを越えたところから、妖精は針に反比例する形でフェーダーを動かす。結果として一定レベル以上で、出力は入力に比例しなくなるが、その一定レベル以下では何の影響も受けない。聴感では一定レベル以上の音量が制限されるため、その制限された部分で「つまった」感覚あるいは拍子抜けした感覚がある。 聴感については使い方によって様々な表現ができる。例えば音量的に不安定で他のパートとのバランスが悪く、素人っぽく聴こえる演奏に使えば、音量的安定が得られ玄人っぽくバランスさせやすい(玄人っぽさの要素の一つは、安定した発音である)といった心理面を含む効果から、距離感の短縮、音量感の変化等が挙げられるが、物理的にはコンプレッサ、リミッタともにダイナミクスの減少とレベル分布歪みである。 本来歪むべき高いレベルと予想される部分でも歪まずに扱えることから、平均音量を高くすることがその使用目的とされることが多いが、このことは後述する問題を含んでいる。 注意1) このようにコンプレッサとリミッターの違いは、スレッショルド概念の有無だけなのであるが、近年刊行された月刊誌等の記述ではこの定義があやふやで、多くの記述ではどちらもスレッショルドを持つように書かれているが、これは明らかに誤りである。また、実際のリミッタ/コンプレッサの製品の多くには、その切り替えスイッチがついていないが、多くの場合スレッショルドの設定ツマミを−無限大(絞り切る)とコンプレッサに、−無限大から僅かでも高いレベルに設定するとリミッターモードとなる。 注意2) 上記で説明したコンプレッサ/リミッタの回路メカニズムは、無帰還ループ形式という一回路形式にすぎない。(最も多く見られるが)この回路の特徴はコンプレッサ・モードからリミッター・モードまで連続的に設定できるメリットがあるが、厳密には完全なリミッティングは出来ない。具体的製品にはdBx社、U−rei社の全製品がある。録音スタジオやPAの現場ではこれらの製品が使用されることが多いせいで、注意1)のような誤った記述が横行するのであろう。ちゃんと英語版マニュアルを読むべきだ。完全なリミッティングが可能な回路形式としては実効値帰還型や筆者オリジナル(アフターディナー、少年ナイフ、紅花林の録音やライブで多用している)の高速積分ループ型(C;1978)がある。これら帰還型の回路では、ゲインの妖精は入力レベルではなく出力レベルを監視し、リミッタの場合、出力レベルが一定値を越えるとフェーダーを下げ一定値を保とうとする。リミッタの説明でそのような説明がしばしばみられるが、それが実際に実行されるのは帰還型回路だけで、スタジオやPAで使用されている製品のほとんどは無帰還型であるため、そのようには作用していない。その帰還型があまり用いられない理由はそれなりのリスクがあるからなのだが・・。 「が)波形変化を伴うとスペクトルが変化し、すなわち音色が変化する。定義上理想のリミッタやコンプレッサには音色変化はない。 ちなみにdbx社の#166のpeak stopはクリッパー回路だが、#1066のpeak stop plusはVCAを用いたリミッタである。 注意3.5) VCAによるリミッタとクリッパーは明確に区別される。VCAによるリミッタではスペクトル(音色)の変化は無いが、(圧縮による音色変化はスペクトルの変化によるものではなく、時間構造上のエンベロップ歪みまたはフィード・スルーによるAM変調で、これまた区別されねばならない)反応に固有の時間遅れがある。クリッパーは波形そのものを整形するため、スペクトルは変化するが反応時間は0である。 注意4) 類似の回路にメモ録音用カセットレコーダやポータブルMD録音機に搭載されているオート録音レベル回路(ALC)があるが、近年発達著しく侮れない。メーカーにもよるが、予測型オートレベルなのである。つまり突発的に大音量が入力されても、予測し事前に最適なところまでレベルを絞って、「その大音量」を待ち構えているのである。このトリックは後述。 3−2−a−c) エキスパンダー擬人化表現 妖精が、入力された信号レベルをメーターで見ながらフェーダーを動かす点では、他のゲインリダクションと同様だが、入力が無信号の時フェーダーは−無限大、入力信号が増大するとそれに比例するようにフェーダーを上げる動作をする。 コンプレッサ同様に、この比例の度合を伸長比(:Ratio)と呼ぶ。 ここまでの説明で理解できると思うが、相対するリダクション比を持つコンプレッサとエキスパンダ(仮にコンプレッサ圧縮比2:1とエキスパンダ伸長比1:2)は互いに相補関係にあり、言い換えれば鏡に写った鏡像のような存在と言うことができる。つまり理論的にはある係数で圧縮した信号を、その逆数の係数で伸長すると元の信号に戻ると言うのである。 〈アペンディックス〉 アナログオーディオ時代、会話録音用に開発されたコンパクト・カセット・テープを音楽鑑賞用に流用することが流行したが(この解釈は歴史的に正しいと思う)、そもそもが会話録音用であるためダイナミック・レンジ、S/N比が悪く(50dB程度)、それを改善する目的で、この技術「相補関係にあるコンプレッサとエキスパンダ」が用いられた。録音はコンプレッサで圧縮された信号を、再生は逆係数のエキスパンダを通して復元することで、見かけのダイナミックレンジやS/N比の改善をしようとしたのである。代表的な方式としてdolby研究所のdolby−Bスライディング・バンド方式(業務用にA方式、末期にはSR方式があるが)とdbx社のデシリニア方式がある。 それぞれの特徴を記述すると、dolby−Bスライディング・バンド方式は人間の聴覚の性質に着目し、高域スペクトルについてのみ可変シェルビング・フィルターによる圧縮/伸長を行い、結果としてS/N比の改善を目的としている。対するdbx社のデシリニア方式では全帯域(低音から高音まで)について圧縮/伸長を行い、結果としてダイナミック・レンジそのものの拡大・改善を目的としている。しかし現実にはこれらの圧縮/伸長は理論ほど正確ではなく、使用するにはレコーダーの基本性能のチューニングが必要不可欠で、それができていないと(一般ユーザーが内部電気回路やヘッド回りの調整を日常的に行うことなど不可能)これらノイズ・リダクションの使用で、逆に音の劣化が促進される結果となる。 ところで、これまた最近目にした無料配布の雑誌記事に、dbx社のデシリニア・テクノロジーがdolby研究所の技術供与によって成立している、という記述があったが、両者は全くの独立した、いやむしろ互いにライバル関係にあったわけで、技術供与などの事実は無い。まあ、社員の何名かがヘッドハンティングされたくらいのことはあるかもしれないが・・。