[論文レビュー] DeXOR: Enabling XOR in Decimal Space for Streaming Lossless Compression of Floating-point Data
DeXORは十進数空間のxorアプローチを導入し、最長共通十進数プレフィックスを抽出し、サフィックスをスケールさせることで浮動小数点データの効率的で無損失なストリーミング圧縮を可能にします。極端なケースに対する例外処理機構を備えます。
With streaming floating-point numbers being increasingly prevalent, effective and efficient compression of such data is critical. Compression schemes must be able to exploit the similarity, or smoothness, of consecutive numbers and must be able to contend with extreme conditions, such as high-precision values or the absence of smoothness. We present DeXOR, a novel framework that enables decimal XOR procedure to encode decimal-space longest common prefixes and suffixes, achieving optimal prefix reuse and effective redundancy elimination. To ensure accurate and low-cost decompression even with binary-decimal conversion errors, DeXOR incorporates 1) scaled truncation with error-tolerant rounding and 2) different bit management strategies optimized for decimal XOR. Additionally, a robust exception handler enhances stability by managing floating-point exponents, maintaining high compression ratios under extreme conditions. In evaluations across 22 datasets, DeXOR surpasses state-of-the-art schemes, achieving a 15% higher compression ratio and a 20% faster decompression speed while maintaining a competitive compression speed. DeXOR also offers scalability under varying conditions and exhibits robustness in extreme scenarios where other schemes fail.
研究の動機と目的
- 高精度浮動小数点ストリームの堅牢なリアルタイム無損失圧縮の必要性を動機づける。
- 浮動小数点データの滑らかさと冗長性を利用する十進空間xorフレームワークを提案する。
- 無損失復元を確保し、計算を管理し、極端なデータケースを処理する最適化を開発する。
- 多様なデータセットでDeXORを最先端スキームと比較評価し、性能向上を確立する。
提案手法
- 接頭辞と接尾辞抽出のためにグローバル整列十進座標系で動作する十進数xorを定義する。
- バイナリ入力から正確で軽量なプレフィックス/サフィックス識別を可能にする誤差耐性丸めを用いたスケールドトランケーションを使用する。
- LCP座標とテール座標をエンコードしてコンパクトなメタデータを保存し、サフィックス再構成を可能にする。
- 最適化された可変長エンコードで十進サフィックスをエンコードし、符号整合性を活用して符号オーバーヘッドを低減する。
- メインパイプラインと同時並行に動作する例外処理機構を提供し、適応的指数減算エンコードで高精度または滑らかでないデータを処理する。
実験結果
リサーチクエスチョン
- RQ1十進数空間のxorは滑らかさと冗長性を共同に活用して浮動小数点ストリームのSLCを改善できるか?
- RQ2コストの高い二進十進変換なしに十進数空間のプレフィックス/サフィックスを正確に識別するにはどうすべきか?
- RQ3DeXORにとってコンパクトで無損失なデコードを支える最適なメタデータとエンコード戦略は何か?
- RQ4極端なデータ条件下で例外処理機構は堅牢性にどう寄与するか?
- RQ5多様なデータセットにおけるDeXORの実証的利得は先行スキームと比べてどの程度か?
主な発見
- DeXORは主要競合より約15%高い圧縮比を達成する。
- DeXORは圧縮速度を抑えず、デコード速度を約20%速く提供する。
- DeXORは条件が変動しても極端なデータセットで堅牢性とスケーラビリティを維持する。他が失敗するケースでも。
- 低精度データセットで、DeXORはデコードと圧縮の速度に大幅な改善を示す。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。