AWS Elemental(3)MediaLive の概要

Elemental MediaLive

MediaLiveは、マルチスクリーンデバイス用に高品質なビデオストリームを作成できる、放送品質の ライブ動画処理サービス 。入力されたストリーミングをリアルタイムでエンコードする。インフラストラクチャ全体をわずか数分で立ち上げることが可能で、スケーリングやフェイルオーバ等の機能も兼ね備えている。MediaLiveは、複数のAZを跨いで透過的に管理されているなど 高い信頼性 があるため、潜在的な問題が生じても、ライブチャンネルが中断されることはない。また、入力されたストリーミングを リアルタイムでエンコード するだけでなく、統計的多重化、広告マーカーサポート、音声機能 (音量正規化、ドルビーオーディオ、複数の字幕規格など) といった高度機能を持つ。

MediaLiveのサービスリミットは以下の通り。

主な特徴

MediaLiveは、以下のような特徴を持つ。

  • 最新のコーデックを含めて様々な動画規格をサポート
  • 広告マーカー、クローズドキャプション、多言語対応の音声トラック、音声ガイド、ラウドネス補正などの機能をサポート
  • インフラストラクチャを自動でデプロイ、スケーリング、修復
  • 他のElementalサービスとの連携が容易

仕組み

ライブストリーミングを行う際には、以下の3つのシステムが含まれることが一般的である。

システム 内容 備考
アップストリームシステム ソースコンテンツの提供 カメラ, エンコーダ
MediaLive チャンネル ソースコンテンツを取り込んでトランスコードを行う MediaLive
ダウンストリームシステム MediaLiveが生成するコンテンツの出力先 MediaPackage, CDN

パイプライン

MediaLiveの内部で、パイプインが生成されて、その中で処理が実行される。 2つのパイプラインを生成することが奨励 されており、この場合は、 それぞれのパイプラインが独立して同じ処理を実行 することで、可用性が向上する。

入力

MediaLiveへの入力は、プッシュとプルの場合が存在し、これらの入力には、 入力セキュリティグループ が関連づけられている。

チャンネル

チャンネルは、 1度に1つの入力からソースコンテンツを読み取りトランスコード を行った上で 出力グループに対してパッケージ化 を行う。出力は複数設定することが可能である。

料金

入力、出力、アドオン機能、アイドルリソース、データ転送のそれぞれのディメンションに対して重量課金される。オンデマンド料金とリザーブド料金が存在し、後者の場合は12ヶ月の契約が必要となる一方で割安な費用で利用できる。

なお、MediaLiveでは、解像度を以下のように定義している。

解像度 ピクセル
SD 〜 1280×720
HD 1280×720 〜 1920×1080
UHD 1920×1080 〜 4096×2160

AWS Elemental(2)MediaConvert の概要

Elemental MediaConvert

MediaConvertは、放送品質のVODコンテンツを簡単に作成できる ファイルベース動画変換(トランスコード)サービス 。さまざまなメディア形式を幅広く利用でき、かつインフラの管理やメンテナンスは不要である。スタンドアローンのサービスとしても、他のElementalサービスと組み合わせて利用することも可能である。

従来のオンプレミス環境では、リードタイムが長く俊敏性に欠けていたが、MediaConvertを利用することでこれらの問題を解決することができる。

主な特徴

MediaConvertの主な機能は、以下の通り。

  • グラフィックオーバーレイ、コンテンツ保護、多言語音声、クローズドキャプションのサポート、プロフェッショナルなブロードキャスト形式など様々な機能
  • 幅広い動画の入出力形式をサポート
  • ワークロードのプロビジョニングを自動化

料金

オンデマンド料金と最短12ヶ月の契約が必要なリザーブド料金が存在する。オンデマンド料金の場合は、ビデオの出力に対して 分単位で課金 される。AVC, VP8, VP9 を用いてシンプルなユースケースが想定されている低料金プラン( ベーシック階層 )と、AVC, HEVC, AV1, VP8, VP9, Apple ProRes, MPEG-2, VC-3, AVC-Intra に対して様々な機能を付加できる プロフェッショナル階層 とが存在する。

設定

ジョブ

MediaConvertは、メディアファイルを様々な形式、サイズ等にパッケージしファイルにトランスコードする。 ジョブは、このトランスコード作業を行う際の対象ファイル、出力先、エンコード設定等を規定 したものである。

ジョブを作成すると、処理をキューに送信し、自動的に処理が開始される。3ヶ月以内のジョブの履歴は参照できる。また、実行したジョブをJSON形式で吐き出すこともできる。エクスポートしたJSONを用いて、新たなジョブを作成することができる。

入力

S3 もしくは HTTP(S) サーバに保存されている対象となるファイルを指定する。1つのジョブには 最大150の入力 を含めることが出来る。 入力URLは必須項目

オーディオセレクタを用いて、入力オーディオを出力オーディオに関連付けることができる。1つの入力ファイルに複数のオーディオトラックが含まれていた場合、 オーディオセレクタを用いて、出力ファイルでどのトラックを使用するかを選択することができる。

またMediaConvertは、複数の入力ファイルから単一の出力ファイルを作成する 入力スティッチングや、単一ファイルの特定の位置のみを抽出する 入力クリップ を利用できる。

各入力の ビデオセレクタ にて、 タイムコードソース埋め込み, 0から開始, 指定 から選択することができる。 また、 全体設定 から 出力タイムラインのタイムコード の設定が可能である。このタイムコードを メタデータ もしくは フレーム自体 に焼き込むかどうかは設定できる。

MediaConvertは、 ビデオフレームをこのタイムコードを基準に管理 する。

カテゴリ 設定項目 内容
Input Supplemental IMPs 補足IMFパッケージ であるかどうか
Input Decryption settings 復号化設定。入力ファイルが暗号化されている場合の復号方法を規定。
Video selector Color space 色空間の変換設定
Video selector Rotate ローテーションの設定。 自動回転 と指定した値による回転が可能。
Video selector Scan type プログレッシブかインタレースかは自動判定。PsF のみ明示的に指定すると品質が維持できる。

出力グループと出力

出力グループでは、以下の2つのカテゴリに分類されるメディアアセットを作成できる。

カテゴリ 内容
ABRストリーミングパッケージ ユーザがセグメントをダウンロードしながら視聴するタイプのパッケージ
単一ファイル ファイル全体を一度にダウンロードしてから視聴するタイプのパッケージ

出力グループを作成したら、グループ内に出力を設定する。ABRストリーミングパッケージ (CMAF、Apple HLS、DASH ISO, Microsoft Smooth Streaming)の場合は、ビデオABRストリーミングおよびオーディオABRストリーミングを指定する。キャプションを追加することもできる。

出力グループとメディアプレイヤーの関係は以下の通り。

再生プレイヤー 出力グループ
古い Apple デバイス Apple HLS
新しい Apple デバイス CMAF
Android デバイス CMAF もしくは DASH
Microsoft デバイス Microsoft Smooth Streaming

MediaConverterは、出力したビデオの時間単位で課金されるため、複数の解像度やフォーマットを同時に出力した場合は、出力の数だけ課金されることに注意が必要である。

CMAF, DASH, Microsoft Smooth Streaming については、 ストリーミング出力のフラグメント長は全ての出力設定で一致 させておかなければならない。フラグメントの長さは、

  • GopClosedCadence
  • GopSize
  • FramerateNumerator, FramerateDenominator

の値の制約を受ける。フラグメントの長さは、整数である必要があり、次の倍数である必要がある。

GOPサイズ * Closed GOP cadence / フレームレート

ビデオの概念

ビデオのエンコード方法を変更するためには、個別に以下のような設定値を変更する必要がある。

フレームレート

MediaConvertは、 可変フレームレード (VFR)の入力には対応しているが、出力は 固定フレームレート (CFR)のみ対応している。フレームレートの変換アルゴリズムは、

  • Drop duplicate (フレームの欠落)
  • Interpolate(ブレンド)
  • FrameFormer(動き保証)

なお、何も設定しなかった場合は、出力フレームレートは入力フレームレートと同一となる。可変フレームレートで入力された場合は、標準フレームレートから計算して最も近い、固定フレームレードに変換される。

プログレッシブとインタレース

インタレースビデオをプログレッシブビデオに変換することができる。それぞれのモードからの変換にどの設定を適応すればよいかについては、有効な設定の組み合わせを参照のこと。

キャプション

キャプションを設定する場合、キャプションとビデオとが同期するように入力タイムラインを設定しなければならない。 Captions Selectors を設定し、形式等の指定を行う。キャプションの設定は、入力側でも出力側でも出来る。

イメージインサータとオーバレイ

Image Inserter を用いると、指定した時刻に静止画もしくはモーショングラフィックを オーバレイ することができる。フェードインフェードアウト、および透過度を指定できる。

入力時と出力時それぞれでオーバレイ処理を設定することができる。また、開始時刻とその期間 , フェード時間 を指定する。静止画オーバレイで使用できるのは、png もしくは tga ファイル、モーションオーバレイの場合は、 mov もしくは png ファイル。 レイヤー指定 により最大100の画像について重ね指定を行うこともできる。

ジョブ全体の設定

最後に ジョブ全体の設定 を行う。例えば、IAMロールを指定することで、MediaConvert およびこのジョブに実行権限を付与することができる。

なお、 ジョブ設定内に変数を使用することができる 。例えば、S3のプレフィックスに日付や時間、ビットレート、フレームサイズ、ファイル名等を指定できる。これらの変数には、 最小桁数を規定できる。

高速トランスコーディング

10分を超えるジョブには、高速トランスコーディングの利用を検討する。超高精細コンテンツやHDRなどのコンテンツが検討すべきコンテンツとなる。

出力プリセット

出力プリセットは、奨励されるトランスコード設定のグループ。システムプリセットを使うことも、カスタムプリセットを作成することもできる。

ジョブテンプレート

奨励されるトランスコード設定のグループ。システムテンプレートを使うことも、カスタムテンプレートを使うこともできる。

キュー

MediaConvertには、 オンデマンドキュー予約済みキュー とが存在し、前者は重量課金、後者は12ヶ月の契約期間が必要で一定のトランスコーディング容量(能力)に対して支払いを行う。

キューは現在行っているジョブが終了すると次のジョブを実行する。キューを 一時停止 することで、次に控えているジョブ以降を停止させることができる。またキャンセルも可能。キューを指定しなかったジョブは、自動的に デフォルトキュー に送信される。デフォルトキューを含み、 最大10個のオンデマンドキュー を持つことができる。ジョブには優先度を指定することができ、この優先度に沿ってジョブの処理を行う。ジョブの実行までの待機時間が長い場合に、他のキューへとホップすることが可能な キューホッピング 機能が用意されている。これを用いることで、処理が急増して待ち時間が長くなった場合のみに、別のキューで並行処理させるようなことも可能となる。

SCTE-35

SCTE-35マーカーは、広告コンテンツ等の挿入ポイントを示し、TS, DASH, HLSに埋め込むことができる。MediaConvertでは、入力に含まれているSCTE-35をパススルーさせるか、もしくは (ESAM)XML 形式のドキュメントで指定することで、SCTE-35を埋め込むことができる。

AWS Elemental(1)MediaConnect の概要

Elemental MediaConnect

AWS Elemental MediaConnectは、IPネットワークが持つ柔軟性、機敏性、経済性と衛星やファイバーが持つ信頼性、セキュリティを兼ね備えた ライブ動画伝送サービス 。クリティカルなライブ動画のワークフローを構築可能で、遠隔地からの動画を取り込んで共有したり、動画ストリームを複製したりすることができる。これにより、リードタイムが長く俊敏性に欠ける衛星やファイバー等を使用することなく、動画の伝送を行うことが可能となる。また、柔軟に開始や停止を行うことができる。

主な特徴

MediaConnectの主な機能は、以下の通り。

  • Zixi, RIST, RTP などの 標準プロトコル をサポート
  • End-to-End の AES暗号化
  • 顧客やパートナーとの素材の共有が可能
  • メトリクスによるモニタリング
  • 単独利用も他のElementalサービスとの連携も可能

料金

アクティブなリソース と データ転送量 に対して課金される。長期契約が必要な割引体系も存在する。

ユースケース

MediaConnectの主なユースケースは以下の通り。

コントリビューション

オンプレミスからクラウドへコンテンツを取り込む ことができる。入力にオンプレミスのエンコーダ、出力にAWSのエンコーダを指定することができる。

ディストリビューション

コンテンツを複数の異なる場所に配布 することができる。MediaConnectを数珠繋ぎで接続することもできる。

エンタイトルメント

他のAWSアカウントに対して出力することができる。これにより顧客やパートナーとコンテンツを共有することができる。なお、共有することができるのは、 同じリージョン内 のリソース間のみ。

設定

フロー

MediaConnect を利用する際には、まず フローを作成 する。フローで設定する入力は、 Standard, VPC, 他のAWSアカウントの入力 から選ぶことができる。プロトコルは、 RIST, RTP, RTP FEC, Zixi から選択できる。

プロトコルに RTP FECを選択した場合、 インジェストポート には指定したポートに加えて、 エラー訂正のためのポートを2つ指定 する必要がある。MediaConnect は、指定したポート+2 および +4 のポートをこのために自動的に利用する。

プロトコル

Zixi は、長距離を含むほとんどのユースケースに使用できる高可用性プロトコル。pull/pushの指定が可能。 RIST は、長距離アプリケーションに適した高可用性、低遅延のプロトコル。MediaConnectは、 暗号化されたRISTはサポートしていないRTPは、FECを仕様した場合、破損やパケット損失を修復できる。FECを使用しない場合は、帯域幅を節約できる。

入力

フローには、1-2つの入力を設定する。入力を2つ設定した場合には、フェイルオーバが可能で、MediaConnectは 両方の入力をプライマリとして扱う 。フェイルオーバを設定する際には、 リカバリウインドウ を指定する必要があり、 デフォルト値は 200msec である。

出力

フローごとに50個まで出力を指定することができる。 出力では、プロトコル, IP 等を指定する。出力できるプロトコルは入力と同じく、 RIST, RTP, RTP FEC, Zixi 。外部のIPに対して、もしくは指定したVPCのIPに対してコンテンツを出力する。

エンタイトルメント

既存のフローにエンタイトルメントを付与して、コンテンツを別のAWSアカウントと共有することができる。エンタイトルメントを付与する場合は、 相手のAWSアカウント受信者に転送料金をどの程度負担させるか , 転送時の暗号化の有無 などを指定する。

コンテンツの配信

異なるリージョン間のMediaConnect間でコンテンツを転送する場合は、 Zixiプロトコルを指定 して転送を行う。また、 MediaLiveに対してコンテンツを転送する場合 は、冗長化のために同一リージョン内で2つのフローを設定 した上で、 MediaLive側でMediaConnectのARNを指定 する。

ベストプラクティス

AWS ElementalMediaConnectのベストプラクティスは、以下の通り。

  • FECやARQを利用 してパケット損失を最小限にとどめる。
  • 異なるAZ 上にフローを作成、もしくは 複数の入力を指定 するなどワークフローを冗長化
  • CloudWatch メトリクス および アラームの活用
  • CIDRブロックの厳格化