Skip to main content
QUICK REVIEW

[論文レビュー] Dynamic Switching of GOP Configurations in High Efficiency Video Coding (HEVC) using Relational Databases for Multi-objective Optimization

Gangadharan Esakki|arXiv (Cornell University)|Jan 1, 2014
Video Coding and Compression Technologies参考文献 7被引用数 2
ひとこと要約

本稿では、HEVCにおける動的GOP設定切り替え機構を提案し、リレーショナルデータベースを用いてビットレート、動画品質(PSNR)、エンコード時間の複数目的最適化を可能にする。事前に計算されたPareto最適な設定を、デバイスおよびネットワーク制約に基づくSQLクエリで取得することで、異種デバイス間でのストリーミングにおいて低遅延かつ品質・ビットレート・計算コストの最適なトレードオフを実現するリアルタイムな適応が可能となる。

ABSTRACT

Our current technological era is flooded with smart devices that provide significant computational resources that require optimal video communications solutions. Optimal and dynamic management of video bitrate, quality and energy demands needs to take into account their inter-dependencies. With emerging network generations providing higher bandwidth rates, there is also a growing need to communicate video with the best quality subject to the availability of resources such as computational power and available bandwidth. Similarly, for accommodating multiple users, there is a need to minimize bitrate requirements while sustaining video quality for reasonable encoding times. This thesis focuses on providing an efficient mechanism for deriving optimal solutions for HEVC codec based on switching GOP configurations. The approach provides a basic system for multi-objective optimization with constraints on power, video quality, bitrate. This is accomplished by utilizing a recently introduced framework known as Dynamically Reconfigurable Architectures for Time-varying Image Constraints (DRASTIC) in HEVC/H.265 codec with six different GOP configurations to support optimization modes for minimum bitrate, maximum quality and minimum computational time (minimum energy in constant power configuration) mode of operation. Pareto-Optimal GOP configs are used in implementing these DRASTIC modes.

研究の動機と目的

  • HEVCにおける多様なデバイスの性能およびネットワーク状態に応じた動画エンコード最適化の課題に対処すること。
  • 異なる計算能力および帯域幅リソースを持つデバイス間で、高品質な動画品質を維持しつつエンコード時間とビットレートを低減すること。
  • ユーザー、デバイス、ネットワーク制約に基づくリアルタイムで動的かつ最適なGOP設定の選択を可能にすること。
  • Pareto最適な設定を用いた多目的最適化をサポートするスケーラブルなデータベースフレームワークの開発。
  • DRASTICベースの再構成可能エンコーダーにデータベース駆動の設定取得を統合し、適応型動画ストリーミングを実現すること。

提案手法

  • HEVCエンコードにおける6種類の異なるGOP構造について、事前に計算されたPareto最適なGOP設定。
  • DRASTICフレームワークを活用し、リアルタイムの制約に基づいてエンコーダーを動的に再構成。
  • デバイス、ネットワーク、ユーザー、エンコーダー設定のテーブルを含むリレーショナルデータベーススキーマを設計。
  • 最大ビットレート、エンコード時間、最小PSNRといった制約に基づき、最適な設定を取得するSQLクエリを実装。
  • データベース変数を用いて、デバイス固有のプロファイル(例:Nexus 5 high profile)を制約のしきい値にマッピング。
  • Paretoフロントテーブルに対するクエリ実行により、特定の動画セグメントの最適なエンコーダー設定(PSNR、ビットレート、エンコード時間)を取得。

実験結果

リサーチクエスチョン

  • RQ1HEVCにおける動的GOP設定切り替えは、複数の対立する目的(ビットレート、品質、エンコード時間)を最適化するためにどのように実現可能か?
  • RQ2リレーショナルデータベースは、リアルタイムで制約に基づいた最適なHEVCエンコーダー設定の選択をどのように可能にするか?
  • RQ3Pareto最適な設定は、効果的に事前に計算され、データベースクエリを介して取得可能であり、リアルタイムな動画適応を支援できるか?
  • RQ4データベース駆動の設定選択を用いることで、システムは異なるデバイスの性能およびネットワーク状態にどのように適応するか?
  • RQ5データベースクエリは、多目的動画エンコードにおけるランタイム最適化をどの程度代替可能か?

主な発見

  • SQLクエリを用いたPareto最適な設定の取得に成功し、動画V001において最大43 dBのPSNR、1085 kbpsのビットレート、107秒のエンコード時間を達成。
  • 高品質モードでは、ビットレート ≤ 600 kbpsおよび時間 ≤ 500 秒の制約下で、PSNR = 38 dB、ビットレート = 548 kbps、エンコード時間 = 302 秒の設定が選択された。
  • 最小ビットレートモードでは、PSNR ≥ 40 dBおよび時間 ≤ 800 秒の制約を満たし、PSNR = 43 dB、ビットレート = 1085 kbps、エンコード時間 = 107 秒の設定が選択された。
  • ユーザー固有の制約は、データベース変数を用いて動的に適用され、例としてNexus 5 high-profileモードでは最大ビットレート = 450 kbps、最大エンコード時間 = 507 秒が設定された。
  • シンプルで効率的なデータベースクエリにより、ユーザーおよびデバイスプロファイルに応じた最適な設定の取得が可能となり、システムはリアルタイムの適応性を示した。
  • 本手法により、スケーラブルでBig Data対応の動画エンコード最適化が実現可能であり、IoTおよび将来のインテリジェントな動画ストリーミングシステムに適している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。