マスタリング論 #2c 2003年3月1日 宇都宮 泰 #2bまでメディア上のデータ連続性、ピット成形についての知識と検査方法を示したが、大切なことはそれらの具体的手法以上に、検証とその論理性について知ることである。しかし#2bまでは、極めて検証の容易な「当たり前の諸元」で、アナログ録音で例えれば「バイアス値の調整」程度のレベルであり、メディア上に存在する音の品質について論じているわけではない。であるにもかかわらず多くの制作現場に於いて、この「当たり前の諸元」が満たされておらず、この問題に追求が及ぶと「音が出てるんだから、それでいいじゃないか!」という回答が帰ってくるのが現実である。「音の品質」以前に「信号の品質」が確保されていないのである。 **** 品質は使用機材のブランドや値段で決まるのではない。論理に裏打ちされた知識と運用方法によってのみ「保たれる」ものである。 **** ここまでの「信号の品質」が満たされているなら、ここから先の「音の品質」についての知識が意味を持ってくる。 2−c)ジッタの背景にあるもの ジッタは時間軸上のデータのゆらぎのことで、先に述べたデータの連続性を微視的に見たものとも言える。入力された音(アナログ量)はデジタルに変換された時点で「単なる数列」と見なすことができる、とされる。この数列への変換は単位時間あたり一定の頻度で行われるが、その頻度がサンプリング周波数である。つまり1秒間に44100回数値化しているときに、サンプリング周波数44.1KHzである、と考える。周期で言うなら1/44100秒に1回の割合で、数値に変換していることになるが、そのタイミングの正確さが問題なのである。(実際のデータは0と1の羅列で、密度は毎秒約3000000ビットで、1と0の比率は暗号化により50%に保たれている。) ところが現実の問題として、2つの音データがあったとして、両者の数列が同一(前項の差分が全く検出できない)であっても、そのことだけでは両者は同一の音にはならないのである。論理的に考察するなら、その音の違いは数列が同一であることから、「それ以外の要因」が原因であると推測できる。同一の数列であることが保証できるなら、残る要因は時間軸上の精度だけである。数列の構成単位であるビット(いわゆる1か0かという最小単位)はメディア上では確かにアナログ量だが、信号処理の過程で波形整形回路によって「明確化」され、中途半端な0.6とか、にはならない。もし1だったものが0に変質すれば、前後の数字の並びからエラーであることが「明確化」し、その後訂正されるからだ。 2−c−b) このように、同一のデータ列であるにもかかわらず、同じ音にならない原因は、現在のところ時間軸上のゆらぎ(=ジッタ)に全て押し付けられているのが現状であるが、この問題はデジタルオーディオの初期に於いて十分には検討されてなかったようである。 アナログオーディオに於いて時間軸上のゆらぎは「ワウ」や「フラッター」と呼ばれ、一般には「回転不良」としてよく知られた存在であった。レコード盤ではレコードの回転数が、テープ録音ではテープの走行精度がそのまま「音程の精度」として表れることから、認知が容易であったためである。「ワウ」は周期が数Hz程度のピッチ変動を、「フラッター」は恒常的なピッチ(回転数あるいは速度)の変移を表す用語である。ワウ・フラッターは1/4インチテープ(オープンリール・テープ=日本の俗称。正しくはリール・トゥー・リール)よりも、カセットテープ(正しくはコンパクト・カセット・テープ)で悪く、鑑賞に耐えるには0.1%以下を保つ必要がある。 これに対して、当初デジタル・オーディオのワウ・フラッターは、原因となる要因が「水晶振動子」の精度のみである、と考えられていたため実効的に0.001%以下で、結果として問題になるほど「存在しない」と考えられていた。現実にはCDよりも早期のデジタル・オーディオである「PCMアダプター+ビデオレコーダー」システムで、聴感上のワウ・フラッターが存在することの指摘や検証も行われ、必ずしも「存在しない」わけではないことも知られていた。(これはビデオレコーダー自体の時間軸精度の基準が、必ずしも高精度の水晶振動子であるわけでは無く、またビデオレコーダーによっては電源周波数(関東50Hz関西60Hz)に同期する機種もあったためである。) それ以外にも独特の音の変容(今でいう空気感や立体感、奥行き感、大きさ感などで、それらが変化するという)も著しく、正弦波以外はだめかな、などと悪口を叩いたものである。因に先の「PCMアダプタ+ビデオレコーダー」を一体化し、専用のフォーマット化したものが、後のDATである。また、レッドブックに定義されるCDのマスターも、基本的には「PCMアダプタ+ビデオレコーダー」で構成される。 当初から「エラー」や「数値の変容」では無いのに「音が劣化している」ことは知られていたことになるが、この時間軸精度とのかかわりはノメカがそのまま追従するわけでは無く、多くの場合PLL回路″Phase Locked Loop″と呼ばれるサーボ系によって実現される数値である。このサーボ系は固有の特性として、「犬追線カーブ」を描き同期するためマクロに見ると高精度であっても、数値ほど揺らぎが無いわけではない。) 問題はその中身なのである。アナログ時代の10の−3乗の回転不良の成分の多くは数Hz以下のスペクトルに集中した「ピッチの変動」や「ある種の音のにごり」として出現するもので、それ以上の高いスペクトルは僅かしか存在しなかったのである。別の見方をすれば「意識しやすい」変化とも言える。(テープ走行系の設計によっては、テープ走行方向の速度ゆらぎや機械的発振が表れる場合もある。これはテープ面の滑り特性や進行方向の局所的弾性や、マス(慣性)の大きさが支配的であると考えられ、その変動成分のスペクトルは高域でロールオフする。また’80年当時ジッタスペクトルと聴感の関連についての研究は僅かであった。現在に於いても十分とは言えない。) これに対してデジタル・オーディオに存在するジッタの影響は複雑で、先に述べた空気感、透明感、立体感などの抽象的事象が多いが、劣悪な場合では音のスペクトルバランスそのものが変化して聴こえる。影響が多岐にわたるのは、ジッタのスペクトル分布の違いによるものと推測されるが、筆者の経験では「非意識領域」の聴覚、つまり意識的には聴こえにくく、印象としてしか取り出せない感覚での変化が大きいように感じられる。しかしそれは決して小さな影響ではなく、何の訓練も受けていないクライアント(録音制作物の依頼者)に、ジッタの多いサンプルと少ないサンプルの2者択一を求めると、明確に少ないジッタのサンプルを選ぶことから、違いは明らかであると思われる。ただ、その根拠を問いただしても、はっきりした説明がなされることは少なく、主張もまちまちである。 2−c−c)ややこしい問題(ジッタという情報) 検証が重要であることは再三指摘しているが、この項目あたりから聴覚と論理の間に矛盾が生じ、運用者はどちらかを選択する必要が発生する。多くの現場では「フル・デジタル」という神々しい響きに惑わされているようだが、2003年の現状ではその響きが単に神々しいだけのようである。セールスフレーズにうたわれているほど論理的完成度は高くないように思われる。 ここに空気感、立体感、解像度、帯域、ともに十分な情報量持ったソースがあったとしよう。(一般的マルチ録音されたCDのほとんどは不合格。コピーでは無い(第1世代、オリジナルの)しかも十分熟練したマイク位置でペア・マイク収録されたものなど) もし、論理どおりに「デジタルに於いて同一のコピーが可能」なら、どのようなメディアに何度コピーをしようと、それが非圧縮で、オン・デジタルで、「エラーが無い」なら、どのコピーとオリジナルを比べても空気感、立体感、解像度、帯域は遜色無いはずである。 また、アナログテープレコーダなどオン・デジタルでは無いので論外、PC取り込みが優秀な予想がたつ。ところが現実には予想と相反する興味深い結果が出る。(この結果については筆者の検証結果であり、世間一般に流布されているものとは異なっている部分もある。興味のある読者は是非追実験していただきたい。) オリジナルソースがDATの場合 劣化度合 オリジナルDAT −−DATへコピー 少ない −−CD−Rへコピー(CDライター使用)DATへのコピーに劣る −−PCへ取り込み 5種中最悪 −−プレス生産 CD-Rへのコピーに劣る −−アナログテープへアナログコピー S/N劣化のみ (要38cps) オリジナルソースがCD−Rの場合(CDライター使用/高精度外部ADコンバータ) オリジナルCD−R −DATへコピー CD-Rへのコピーに劣る −−CD−Rへコピー(CDライター使用) 少ない −−PCへ取り込み 5種中最悪 −−プレス生産 DATへのコピーに劣る −−アナログテープへアナログコピー S/N劣化のみ (要38cps) オリジナルソースがPCの場合(ハード/ソフトは後述) −− PC上のソフトで内蔵CD-Rで書き込み USBより少し良好 −− USB I/F で外部ドライブで書き込み 全方法中最悪 −− SPDIF I/FからDATへコピー 内蔵CD-Rドライブより良好 −− SPDIF I/FからCDライターへ 内蔵CD-Rドライブより良好 *アナログテープへのコピーは、十分なマシン・チューニングを施し、なおかつ ソースやテープに対してバイアス、高域補償を最適化した場合。(筆者所有RT−2 022A,RS−1500Uext,A−810などで確認) *CD−Rへのコピーはバッファー・フローティングによる非ワードシンク・モードで 実施。(CD−RW700で書き込み。再生はCDプレーヤ/P社PD−3000) *プレス生産は筆者が使用している、関東M社および韓国S社の製品を独自評価。 *PCはマッキントッシュG4/PT96またはwinP4/CDアーキテクトで 同様の結果。ただし運用方法は最良として。 これらの結果はいまさらながらの様相であるが、見落としてはならない傾向が伺える。例えばオリジナルソースがDATの場合、同じDATへのコピーは比較的良好なことである。同様にCD−Rの場合、CD−Rへのコピーは比較的良好である。無論コピーを重ねれば明らかに劣化が進行する。 これに対して、異種メディアへのコピーは劣化の度合が大きく、またCDライターを再生側に使用したCD−Rへのコピーも同様に劣化が加速する。 これらのことから、それぞれのメディアには固有のジッタがあり、そのジッタが再現されたときに情報量(劣化の無さ)は最大になるものと考えられる。つまりDATに固有のジッタはCDライターに送り込まれた時点で希薄になり(ジッタの数値としては低下するが)固有の情報も損われる可能性があることになる。同じDATでも小径ヘッドのポータブル機で録音したものを、大径ヘッドの据え置き機で再生すると同様に劣化が表れる場合がある。(録音に使用したヘッドやメカでベストな再生がしやすいのは、アナログと同じようだ。)言い換えればジッタも情報の一部と考えるべきなのかも知れない。この「ジッタを情報として扱う」考え方に従うなら、必ずしもデジタル・ダイレクトなコピーに分があるわけでは無く、むしろリサンプル・モード(同じサンプリング周波数で、サンプリング・レート・コンバートを行うモード)の方がメリットがある場合もある。リサンプルすることでジッタ情報が固定化されるのである。(もちろんリサンプルによるデメリットもあるので、実行するかどうかは最終的にはヒアリングで決めるしか無い。そのための高価なモニタースピーカだろう。) ワードシンク機能のある装置で同期していれば完全だと信じている輩も多いが、ワードシンクとてPLLの一種であることにかわりなく、その装置のフリーラン周波数やタスクによっては逆効果(ジッタが悪化、あるいは最悪リンギング現象)になる場合もある。ワードシンクを生かすためには、フリーラン周波数の調整やロックイン・レンジ、サーボゲイン等の最適化を、知識、技術ともに伴わせる必要がある。(アナログ録音の時代には、これによく似た問題で、シンクロナイザーのパラメーター設定で悩まされた者も多いだろう。) 2−c−d)さらにややこしい問題(D/Aコンバータは何処) モニター・スピーカに何を使用するか、という問題と似ているが、それと同様にD/Aコンバータの違いによる音の違いはバラエティーに富んでいる。モニター・スピーカ同様に、作業の判断に使用するものだけに選定には慎重を期したいものである。単に良い音のするコンバータを使用すれば良いなら話は簡単である。それはモニター・スピーカの選定でも同様なのだが、忘れてはならないことは「再生互換性」の確保である。スタジオで使用されるモニター・スピーカとして有名な機種として、古くはオーラトーン、ちょっと前までならNS−10シリーズがある。私に他のweb著作の中で、NS−10シリーズについて相当ひどくコケおろしているが、この製品の擁護派の言い分は、この「再生互換性」や急進派に至っては「普遍性」すら口にする。何が良い音で何が悪い音か押し付けるつもりは無いが、音メディアが情報伝達の一部なのなら、過剰に情報量の低い道具をもってして「標準」と言い切る事は押し付けの最たるものだろう。もし自分がひどい近視で視力0.1くらいだと仮定しよう。眼鏡やコンタクトもせず、このボケ味が「良い」とは思わないはずだ。ましてそんな状態では絵を書いたり、映画を見たり、ゲームをしたりしないだろう。ところが音の世界ではそんなことがまかり通っている。そんなことだから難聴になってしまうのだろう。 D/Aコンバータについても同様のことが言えるはずなのに、モニターの方法は様々で、「標準」と言えるものの存在が希薄で、何を基準に音づくりしているのかわからない現場が多い。CDのマスタリングなら、CDプレーヤから出力される音を基準に考えるべきなのに、PCから出力される音や、CDライターから出力される音で判断しているのをしばしば見かける。これらのD/Aコンバータは、同じD/Aコンバータの名称でも、質も動作状態もまったく異なっている。当然音も違う。どちらが良いかは「単なる主観」に過ぎず、およそ「標準」や「再現性」の目安にはならない。96Kサンプリングや24ビットなどの数値は確かに魅力的ではあるが、決して「良い」ことの補償にはならないし、まして「標準」とは何の関係も無い。また技術のある者ならCDプレーヤのコンバータに、PCからの信号を割り込ませたり、CDプレーヤと同じコンバータを作れるかもしれない。しかしこれもまた「標準」にはならないのである。なぜならジッタを含む動作状態が、CDを再生したときとは大きく異なるからである。 ジッタとはそうゆう問題なのである。試せば容易に理解できることだ。 ** ジッタの検証 ** 測定用に作った専用のメディアではなく、実際の音の入ったプレスCDやCD−Rのジッタを測定することは容易ではない。その理由はジッタはメディア板とスピンドルのチャッキング(装着具合。トレーの閉め方でも変化してしまう)や、メディアの真円度、スピンドルのスラストクリアランス(縦方向のガタ)、軸受けの潤滑状態や磨耗状態などと、メディア上のジッタ真値が、混然一体となって表れるため、データをとっても相当熟練しないと真値の把握は困難と思う。しかしこれらのメカ起因のジッタも「再生機の診断」と考えれば、データをオーバーオールに評価し、聴覚と関連付ける(=訓練)ことで意味を持つと思う。 ジッタを正確に測定するには、個々のビットの位置を正確な基準時間と比較し、そのスペクトルを評価する必要があるが、専用のハードウェアと高度な知識が必要となる。またプレーヤも相当の改造が必要があり、マスタリング運用者の領域を越えてしまう。 ジッタの絶対値は得られないが、相対的評価や比較で良いならば次の方法が簡易である。CDプレーヤはスピンドル、トラッキング、フォーカスなどのサーボ系で成立しているが、このうちスピンドルとトラッキングのサーボにはジッタが表れる。表れると言うよりもジッタを吸収する方向で、つまり「反ジッタ」信号が本来の信号に重なっている。どちらからでも取り出しは容易である。これはサーボ系が閉ループでできていることから、極論するならそのループのどこから信号を取り出しても良いことになる。最も取り出しが用意なのはスピンドル・モータ(CD板を回しているモータ)か、トラッキング・モータ(レーザーヘッドを移動させているモータ)の端子から信号を取り出せるわけである。(モータが劣化していたり、特殊な機構のものでは取り出しにくい場合もあるが)その取り出した信号から直流成分を取り除き、FFTなどのスペクトル・アナライザーで評価すれば良い。一説ではトラッキングサーボから取り出した方が分かり良い、と言われているが、CD−Rのようにトラッキング方向にタイム・コードが刻まれている場合、そのタイムコードの振幅を観測しているのか、ジッタを見ているのか分からない場合もある。この点を考慮するとスピンドル・モータか、そのサーボから取り出した方が判定や比較が容易である。 ** このテキストに登場する用語や意味が分からずに「プレス用マスターディスク」を作成している者は、それらが理解できる者と組むか教えを乞うべきである。筆者はそう努力している。この業界の最も「ダメ」なことは教えを乞う習慣が無いことだ。無知を誇るものは去れ! ** **** これらの検証や測定は、いざ「マスターディスク」の評価の必要があってから行うのではなく、普段からメンテナンスの一貫として行うべきである。そうすれば自動的に使用可能なメディアやドライブ、運用方法で迷うことやキャッチコピーやウワサに惑わされることなどないはずだ。筆者は迷う事なく、確実にそれらを選択し自信をもって運用出来ている。このテキストでは敢えて評価結果を示さないが、ブランドやウワサは正しくないものが多く、また、筆者の手掛けた仕事が「音楽」として高く評価されていることを誇って良いとも思っている。 ****