QUICK REVIEW

[논문 리뷰] On the Rényi Rate-Distortion-Perception Function and Functional Representations

Jiahui Wei, Marios Kountouris|arXiv (Cornell University)|2026. 01. 17.

Wireless Communication Security Techniques인용 수 0

한 줄 요약

이 논문은 Rate-Distortion-Perception 프레임워크를 Sibson의 alpha-상호정보를 사용하여 Rényi 정보 체계로 일반화하고, 가우시안 케이스 해를 도출하며, alpha에 따라 heavy-tailed와 finite-support 코드북 사이의 기능 표현에서 위상 전이를 밝혀낸다.

ABSTRACT

We extend the Rate-Distortion-Perception (RDP) framework to the Rényi information-theoretic regime, utilizing Sibson's $α$-mutual information to characterize the fundamental limits under distortion and perception constraints. For scalar Gaussian sources, we derive closed-form expressions for the Rényi RDP function, showing that the perception constraint induces a feasible interval for the reproduction variance. Furthermore, we establish a Rényi-generalized version of the Strong Functional Representation Lemma. Our analysis reveals a phase transition in the complexity of optimal functional representations: for $0.5<α< 1$, the coding cost is bounded by the $α$-divergence of order $α+1$, necessitating a codebook with heavy-tailed polynomial decay; conversely, for $α> 1$, the representation collapses to one with finite support, offering new insights into the compression of shared randomness under generalized notions of mutual information.

연구 동기 및 목표

Sibson의 alpha-상호정보를 사용하여 Rate-Distortion-Perception를 Rényi 정보 설정으로 일반화한다.
MSE 왜곡 및 인지 제약하에서 스칼라 가우시안 소스에 대한 닫힌 형태의 Rényi RDP를 도출한다.
Poisson 함수 표현을 사용한 Rényi 일반화된 Strong Functional Representation Lemma(SFRL)을 확립한다.
alpha에 따라 코드북 지지의 구조를 특징짓고 위상 전이가 나타나는 최적 Rényi 표현을 규명한다.
일반화된 상호정보 아래 Campbell의 코딩 비용과의 관련성을 논의하고 강건하고 분포-시프트된 모델링에 대한 시사점을 논의한다.

제안 방법

Rényi RDP 함수 R_alpha(D,P)를 P_{Y|X}의 I_alpha(X;Y)의 II(Infimum)로 정의하고, 왜곡 E[d(X,Y)] ≤ D 및 인식 d_P(P_X,P_Y) ≤ P를 만족하도록 한다.
볼록성 특성을 증명하고 최적화를 가능하게 하는 볼록 대리목 J_alpha(X;Y)=2^{((alpha-1)/alpha) I_alpha(X;Y)}를 사용한다.
가우시안 X ~ N(0, sigma_X^2)이며 제곱 오차 왜곡일 때, R_alpha(D) = (1/2) log(1 + alpha (sigma_X^2 - D)/D) 를 도출하고 Y = cX + Z라는 선형 가우시안 테스트 채널을 통해 달성 가능함을 보이고 sharp Young 부등식으로 검증한다.
인지를 포함시켜 재생 분산을 가능한 구간으로 한정하고 RD 최적 분산을 교차점으로 사영하여 R_alpha(D,P)를 얻는다.
Sibson 최적 주변 분포 Q_{Y_alpha}에 대해 Poisson 함수 표현을 사용하여 Rényi regime에 Strong Functional Representation Lemma(Rényi-SFRL)을 확장한다.
기능 표현에서 지수 K의 Rényi 엔트로피에 대한 경계를 도출하고, alpha가 (0.5,1)일 때는 무한 지지의 heavy-tailed 코드, alpha > 1일 때는 유한 지지 표현을 보인다.
Campbell의 코딩 비용과의 연관성을 논의하고 스칼라 가우시안 소스에 대한 수치적 검증을 제공한다.

실험 결과

연구 질문

RQ1Rényi rate-distortion-perception 함수 R_alpha(D,P)는 무엇이며 일반 소스에 대해 어떻게 계산될 수 있는가?
RQ2Rényi 체계를 고려할 때 인지가 재생을 어떻게 제약하는가, 특히 가우시안 소스에 대해?
RQ3Rényi-일반화된 Strong Functional Representation Lemma를 확립할 수 있는가, 그리고 최적 표현의 구조와 비용은 무엇인가?
RQ4알파가 0.5와 1을 넘을 때 기능 표현에서 코드북 지지 및 꼬리 동작 측면에서 어떤 위상 전이가 발생하는가?
RQ5이러한 Rényi 기반 결과가 Campbell의 코딩 비용 및 일반화된 상호정보 하에서 공유 난수의 실용적 코딩과 어떤 관련이 있는가?

주요 결과

MSE 왜곡을 갖는 가우시안 소스에 대해, Rényi RDP 함수는 R_alpha(D) = (1/2) log(1 + alpha (sigma_X^2 - D)/D).
인지 제약은 재생 분산의 가능한 구간으로 축소되고, 최적의 sigma_Y^2은 왜곡- 및 인지-가능 구간의 교차점으로의 유클리드 사영이다.
Sibson 최적 주변 분포에 대한 Poisson 함수 표현을 사용하여 Rényi-일반화된 Strong Functional Representation Lemma를 확립하고, 코딩 비용을 Sibson의 I_alpha+1(X;Y)와 연결한다.
0.5 < alpha < 1일 때 최적 표현은 무한 지지에 heavy polynomial tails를 가지며, alpha > 1일 때는 p_k가 유한 K_max를 넘으면 0이 되는 유한 지지로 붕괴한다.
heavy-tailed 구간은 코딩 비용이 alpha+1 발산에 의해 상한을 가지고, 유한 지지 구간은 로그 모멘트를 통해 상한을 가지며, 복잡도/왜곡/인지의 상이한 트레이드오프를 강조한다.
가우시안 X를 이용한 수치 시뮬레이션은 heavy-tailed 대 finite-support 동작을 확인하고 Rényi-SFRL 경계를 검증한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.