[論文レビュー] Mitigating Artifacts in Pre-quantization Based Scientific Data Compressors with Quantization-aware Interpolation
post-decompression量子化対応補間を導入して、量子化前データ圧縮器に起因するアーティファクトを緩和し、圧縮スループットを変更せずにデータ品質を向上させる。
Error-bounded lossy compression has been regarded as a promising way to address the ever-increasing amount of scientific data in today's high-performance computing systems. Pre-quantization, a critical technique to remove sequential dependency and enable high parallelism, is widely used to design and develop high-throughput error-controlled data compressors. Despite the extremely high throughput of pre-quantization based compressors, they generally suffer from low data quality with medium or large user-specified error bounds. In this paper, we investigate the artifacts generated by pre-quantization based compressors and propose a novel algorithm to mitigate them. Our contributions are fourfold: (1) We carefully characterize the artifacts in pre-quantization based compressors to understand the correlation between the quantization index and compression error; (2) We propose a novel quantization-aware interpolation algorithm to improve the decompressed data; (3) We parallelize our algorithm in both shared-memory and distributed-memory environments to obtain high performance; (4) We evaluate our algorithm and validate it with two leading pre-quantization based compressors using five real-world datasets. Experiments demonstrate that our artifact mitigation algorithm can effectively improve the quality of decompressed data produced by pre-quantization based compressors while maintaining their high compression throughput.
研究の動機と目的
- 量子化前データ圧縮器が生み出すアーティファクトを特徴づけ、量子化インデックス関連の誤差を理解する。
- データ圧縮スループットに影響を与えないポストデコードのアーティファクト緩和手法を開発する。
- さまざまな量子化前圧縮器に適用できる量子化対応補間アルゴリズムを設計する。
- 共有メモリ・分散メモリ環境で効率的に実行するためのアーティファクト緩和の並列化。
- 実世界データセット上で主要な量子化前圧縮器を用いた方法を検証する。
提案手法
- 量子化インデックスとデコード誤差の相関を特徴づけ、量子化境界近傍の符号と大きさの挙動を含めて調べる。
- ユークリッド距離変換を用いて量子化境界と符号反転境界までの距離を計算し、逆距離加重で二点補間を行う量子化対応補間アルゴリズムを開発する。
- デコード後に補償を適用し、補間された誤差補正を追加してデータ品質を向上させ、圧縮段には触れない。
- 共有メモリ用にOpenMP、分散メモリ用にMPIでフレームワークを並列化し、プロセッサ境界近傍の最適化を含める。
- cuSZおよびcuSZp2などの複数の量子化前圧縮器へ適用性を5つの実世界データセットで実証する。
実験結果
リサーチクエスチョン
- RQ1量子化前データ圧縮器における支配的なアーティファクトパターンは何か。
- RQ2ポストデコード、量子化対応補間で圧縮スループットを変えずにアーティファクトを緩和できるか。
- RQ3EDTと符号伝搬を用いて、次元間でデコードデータを正確に補間・補償できるか。
- RQ4提案手法は主要な量子化前圧縮器と実世界データセットに一般化できるか。
- RQ5アーティファクト緩和によるデータ品質(例:SSIM/PSNR)と実効圧縮利得はどの程度改善されるか。
主な発見
- 量子化前圧縮器のアーティファクト緩和はデータ品質の著しい改善をもたらす。
- 本手法はデコードデータのSSIMを最大108.33%改善。
- SSIMが一致した場合、cuSZおよびcuSZpそれぞれで圧縮比が最大1.17×および1.34×向上。
- 量子化対応補間はデコードデータ上でのみ動作し、圧縮パイプラインを変更しないため高いスループットを維持。
- フレームワークは共有メモリおよび分散メモリの両方の並列化をサポートし、スケーラビリティと性能を維持。
- 高スループットな科学ワークフロー向けにPSNRの改善とともに誤差境界の緩和もサポート。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。