ビデオとオーディオのエンコードについて



ビデオとオーディオをデジタル形式で録画および録音する場合、品質、ファイルサイズ、ビットレートの各バランスを考慮する必要があります。ほとんどの形式では、圧縮による品質の低下を数段階から選択できるようにして、ファイルサイズとビットレートを下げています。圧縮は、効率的に保存、送信および再生できるようにムービーのデータサイズを縮小する重要な処理方法です。圧縮を行わない場合、標準規格のビデオの 1 つのフレームを格納するのに、約 1 MB(メガバイト)の容量が必要になります。NTSC のフレームレートは約 30 フレーム/秒で、圧縮されていないビデオは約 30 MB/秒で再生されるため、35 秒のフッテージを保存するのに必要な容量は 1 GB になります。DV 形式の NTSC ファイルに圧縮すると、約 3.6 MB/秒のビットレートで 5 分間のフッテージが 1 GB の容量に収まります。可能な限り高品質で配信することを目的としてビデオを圧縮するには、ファイルサイズとビットレートが配信先のメディアと再生デバイスで許容される範囲で最小となる圧縮率を選択します。

ムービーファイルを書き出す場合、再生に使用するデバイスの種類や帯域幅に合わせてコンプレッサ / デコンプレッサ(エンコーダ / デコーダ、あるいはコーデック)を選択し、データを圧縮してデバイスや帯域幅に応じたファイルを作成します。

コーデックには様々な種類があり、あらゆる状況に適応するようなコーデックはありません。 例えば、アニメーションの圧縮に最適なコーデックは、一般的に実写映像の圧縮には適していません。 ムービーファイルを圧縮するときに、コンピュータ、モバイルデバイス、Web、または DVD プレーヤーのそれぞれに合わせて、最高画質で再生ができるように設定を調整することができます。 エンコーダによっては、不規則なカメラの動きやフィルムの粒子など圧縮に干渉するものを取り除いて圧縮し、ファイルサイズを小さくできる場合があります。

デジタルビデオの初心者の方や、デジタルビデオについてや高画質ビデオコンテンツのエンコーディングについて興味がある方は、この情報を参照することで、ビデオを異なるアプリケーションや視聴環境に合わせてエンコードする際のトレードオフについて把握できます。

フレームレート

ビデオは、画像のシーケンスを画面に連続してすばやく表示することで、動いているような効果を与えるものです。1 秒当たりに表示されるフレームの数をフレームレートと言い、フレーム/秒(fps)という単位で表されます。画像シーケンスの表示に使用されるフレームレートが高いほど、またフレーム/秒の値が大きいほど、動きが滑らかになります。ただし、画質を上げるためにフレームレートを高くすると、ビデオを表示するためのデータ量が膨大になり、より多くのバンド幅を使用することになります。

デジタル形式で圧縮されたビデオを操作する場合は、フレームレートが高いほど、ファイルサイズが大きくなります。ファイルサイズを小さくするには、フレームレートまたはビットレートを低くします。ビットレートを低くしたときにフレームレートを変更しないと、画質が低下します。フレームレートを低くしたときにビットレートを変更しないと、ビデオの動きの滑らかさが予期したものよりも下回る場合があります。

ネイティブフレームレート(ビデオが最初に撮影されたときのフレームレート)では、ビデオが最適な状態で表示されるため、配信チャンネルと再生プラットフォームに余裕がある場会は、フレームレートを高いままにすることをお勧めします。フルモーション NTSC(米国の National Television System Committee が定義した規格)の場合は、29.97 fps を使用します。PAL(Phase Alternating Line、ヨーロッパで主流のテレビ規格)の場合は、25 fps を使用します。フレームレートを低くすると(エンコードしなければならないビデオデータの量が大幅に減少します)、Adobe® Media Encoder CS4 は、リニアレートでフレームを低くし、新しい fps レートを達成します。ただし、フレームレートを低くする必要がある場合は、元のフレームレートを割り切れる値にすると、最適な結果が得られます。例えば、ソースのフレームレートが 24 fps であれば、12 fps、8 fps、6 fps、4 fps、3 fps または 2 fps にフレームレートを下げます。また、ソースのフレームレートが 30 fps であれば、15 fps、10 fps、6 fps といったようにフレームレートを調整します。

注意: ビデオクリップが 10 分より長い場合は、29.97 fps 以外のフレームレートを使用したり、29.97 fps を割り切れるフレームレートに下げないと(29.97 の 半分の 14.98 fps など)、オーディオの同期が明らかにずれます。

ビデオクリップを高いビットレートでエンコードする場合は、フレームレートを低くすることで、性能の低いコンピュータでの再生が改善されます。例えば、語りだけでほとんど動きのないビデオクリップを圧縮する場合、フレームレートを半分に減らしても、ビットレートは 20 %程度しか減少しません。それに対して、動きの多いビデオを圧縮する場合は、フレームレートを減らすとビットレートも大幅に減少します。

ビットレート

ビットレート(データレートとも呼ばれる)は、ビデオクリップの画質と、バンド幅の許容範囲内でファイルをダウンロードできる配信先に影響を及ぼします。

ビデオをインターネット経由で配信する場合は、低いビットレートでファイルを作成します。高速インターネット接続を使用しているユーザは、すぐにビデオを見ることができますが、ダイヤルアップ接続を使用しているユーザは、ファイルをダウンロードするのに時間がかかります。配信先としてダイヤルアップユーザが想定される場合は、ダウンロード時間が許容範囲内に収まるように、短いビデオクリップを作成します。

キーフレーム

キーフレームとは、ビデオクリップに一定の間隔で挿入される完全なビデオフレーム(または画像)です。キーフレームの間のフレームには、キーフレームの間で発生する動きやシーンの変化に関する情報が格納されます。例えば、人物が戸口の前を歩いて通り過ぎるビデオの場合、キーフレームには人物と背景のドアの完全な画像が格納され、キーフレーム間にある中間フレームには、ドアの前を歩く人物の動きを記述する情報が格納されます。

初期設定では、Adobe Media Encoder はビデオクリップのフレームレートに基づいて、使用するキーフレームの間隔を自動的に判断します。キーフレームの間隔の値により、Encorder がビデオ画像を再評価し、フルフレームまたはキーフレームをファイルに記録する頻度が指定されます。Adobe Media Encoder では、この設定はキーフレーム間のフレーム数を示すキーフレームの間隔の値になります。Adobe Media Encoder は、複数のフレームを比較して余分な情報を省略することで、画面上の全ピクセルのすべての値を予測し、キーフレーム間に存在するフレームの数を概算します。

通常、ビデオクリップ内でのシークでは、デフォルトのキーフレームの間隔の値によって適切なレベルの制御が得られます。キーフレーム位置のカスタム値を選択する場合は、キーフレーム間隔が小さいほどファイルサイズが大きくなることに注意してください。

フッテージにシーン変化や動きが速いアクションまたはアニメーションが多く存在する場合は、キーフレームの間隔を小さくすることで、全体的な画質が向上することがあります。通常、キーフレームの間隔を大きくすると画質が向上します。これは、フレーム間で変化しない画像の領域を記述するためにデータが浪費されないためです。

縦横比(フレームサイズ)

フレームレートと同様に、ファイルの縦横比(またはフレームサイズ)は、品質の高いビデオを作成するために重要です。特定のビットレート(接続スピード)では、フレームサイズが増加するとビデオの品質が低下します。ドキュメントのフレームサイズを選択するときは、完成度の高いビデオを作成するために、フレームレート、ソースのビデオクリップの縦横比、および個別の設定を考慮する必要があります。インターネットにおける標準的な表示解像度は、640 x 480、512 x 384、320 x 240、または 160 x 120 ピクセルです。

最も一般的な縦横比は 4:3(標準テレビ)です。最近では、16:9 や 2:1(ワイドスクリーン)の縦横比も普及し始めています。通常は、最初に撮影したときと同じ縦横比でビデオをエンコードします。ビデオクリップの縦横比を変更すると、ほとんどの場合、黒いバー(またはマスク)が画像の左右や上下に配置されます。黒いバーは、ワイドスクリーンでの視聴を意図して作成されていないビデオをワイドスクリーン画面で表示する場合や、幅の狭いワイドスクリーン画像を幅の広い縦横比の範囲内に表示する場合に必要になります。元のビデオは縮小され、ワイドスクリーンフレームの中央に配置されます。ただし、デジタルビデオ(DV)形式をエンコードする場合は、作業が異なります。これは、長方形ピクセルを使用している DV の縦横比が 4:3 の縦横比とは若干異なっているからです。デジタルビデオカメラで撮影したビデオコンテンツをエンコードする場合は、使用する DV 形式のフレームサイズを手動で指定してビデオの縦横比を維持するか、適切なプリセット(NTSC または PAL など)を選択します。

次のリストは標準的なフレームサイズをまとめたものです。個々のプロジェクトに最適な設定については、実際に試して判断してください。

4:3 縦横比のビデオのフレームサイズ:

  • モデム(56k):160 x 120

  • DSL:320 x 240

  • ケーブル:512 x 384

  • ケーブル/社内 LAN:640 x 480

    16:9 縦横比のビデオのフレームサイズ:

  • モデム(56k):192 x 108

  • DSL:384 x 216

  • ケーブル:448 x 252

  • ケーブル/社内 LAN:704 x 396

非正方形ピクセルのビデオ

スタティックコンピュータグラフィックのほとんどは、幅と高さの比率が 1:1 の正方形ピクセルを使用しています。一方、デジタルビデオでは、幅と高さの比率が異なる長方形ピクセルが一般的です。これは、アナログビデオ(テレビ放送など)とデジタルビデオ(DVD ビデオなど)を同時に使用するためです。非正方形ピクセルのビデオ形式(またはアナモルフィックビデオ)をエンコードする場合は、ビデオ画像を適切な表示縦横比(DAR)に再サンプリングします。

例えば、標準の NTSC デジタルビデオ(DV)のフレームサイズは 720 x 480 ピクセルで、4:3 の縦横比で表示されます。つまり、ピクセルは長方形の形をしており、ピクセル縦横比(PAR)は 10:11(背が高く幅が狭いピクセル)になります。MPEG 1 および 2 ビデオは、様々なサイズ(720 x 480 または 480 x 480 が一般的)で生成されますが、ほとんどの場合、4:3 または 16:9(ワイドスクリーン)の縦横比で表示されます。

非正方形ピクセルを使用しているビデオをエンコードするときに使用する画像のフレームサイズを計算するには、まずマスターとして使用する寸法(幅または高さ)を決定し、その寸法に合わせて他の寸法を次のように計算します。

高さをマスター寸法にする場合は、次の公式で幅を計算します。


例えば、4:3 の縦横比を使用しているビデオの場合、式は次のようになります。


幅をマスター寸法にする場合は、次の公式で高さを計算します。


例えば、4:3 の縦横比を使用しているビデオの場合、式は次のようになります。


フレームサイズが 720 x 480 ピクセルのビデオを 4:3 の縦横比でエンコードする場合は、ビデオフレームのエンコードに使用する幅をピクセル単位で決定します。


計算の結果、ビデオ画像の高さは 640 ピクセルになります。

つまり、720 x 480 の画像は、標準の 4:3 縦横比の 640 x 480 の画像にエンコードする必要があります。

インターレースビデオとノンインターレースビデオ

インターレースソースをノンインターレース出力にエンコードするように選択している場合、Adobe Media Encoder では、エンコードする前にビデオのインターレースが解除されます。

ほとんどの放送用ビデオはインターレースですが、新しい高精細なテレビ規格にはインターレースのものとノンインターレースのものがあります。インターレースビデオは、各ビデオフレームを構成する 2 つのフィールドで成り立っています。各フィールドには、フレーム内の水平走査線の数の半分が含まれています。奇数フィールド(または上位フィールド)にはすべての奇数ラインが、偶数フィールド(または下位フィールド)にはすべての偶数ラインが含まれています。インターレースビデオモニタ(テレビなど)では、最初に一方のフィールドのラインをすべて描画した後、もう一方のフィールドのラインをすべて描画することによって、各フレームを表示します。フィールドオーダーは、どちらのフィールドを先に描画するかを指定します。NTSC ビデオでは、新しいフィールドは 1 秒間に約 60 回画面に描画されます。これは、約 30 フレーム/秒のフレームレートに相当します。

ノンインターレースビデオのフレームはフィールドに分割されません。プログレッシブスキャンモニタでは、すべての水平走査線を、上から下に 1 パスで描画することによって、ノンインターレースビデオのフレームを表示します。このため、ビデオフレームを構成する両方のフィールドが同時に表示されます。コンピュータのモニタはビデオを 30 fps で表示するため、コンピュータのモニタで表示するほとんどのビデオはインターレースされません。