Skip to main content
QUICK REVIEW

[논문 리뷰] Aligning Text-to-Image Models using Human Feedback

Kimin Lee, Hao Liu|arXiv (Cornell University)|2023. 02. 23.
Advanced Image and Video Retrieval Techniques인용 수 35
한 줄 요약

본 논문은 인간 피드백을 수집하고, 이 피드백으로 보상 함수를 학습한 다음 보상 가중 우도를 통해 모델을 미세조정하여 텍스트-이미지 정렬을 개선하는 세 단계 파이프라인을 제안한다.

ABSTRACT

Deep generative models have shown impressive results in text-to-image synthesis. However, current text-to-image models often generate images that are inadequately aligned with text prompts. We propose a fine-tuning method for aligning such models using human feedback, comprising three stages. First, we collect human feedback assessing model output alignment from a set of diverse text prompts. We then use the human-labeled image-text dataset to train a reward function that predicts human feedback. Lastly, the text-to-image model is fine-tuned by maximizing reward-weighted likelihood to improve image-text alignment. Our method generates objects with specified colors, counts and backgrounds more accurately than the pre-trained model. We also analyze several design choices and find that careful investigations on such design choices are important in balancing the alignment-fidelity tradeoffs. Our results demonstrate the potential for learning from human feedback to significantly improve text-to-image models.

연구 동기 및 목표

  • 텍스트 프롬프트와 생성된 이미지 간의 미정합을 텍스트-이미지 모델에서 동기화하고 정량화한다.
  • 인간 피드백에서 정합성과 인간 의도와의 정합성을 포착하는 보상 함수를 학습하는 비용 효율적인 방법을 개발한다.
  • 보상 가중 목표를 사용하여 확산 기반 이미지 생성기를 미세조정하여 프롬프트 충실도와 구성을 개선한다.
  • 정합성과 이미지 충실도 간의 트레이드오프를 평가하고 데이터 다양성 및 보조 손실의 설계 선택을 분석한다.

제안 방법

  • 정렬 강화를 위한 프롬프트(색상, 개수, 배경)를 사용해 정합성을 스트레스 테스트하는 다양한 이미지를 생성한다.
  • 이미지-텍스트 쌍에 대한 정합성에 관한 이진 인간 피드백을 수집한다.
  • CLIP 임베딩을 사용해 인간 판단을 예측하는 보상 모델 r_phi(x,z) 을 훈련하고 일반화를 개선하기 위한 보조 프롬프트 분류 손실을 도입한다.
  • 정규화를 위한 사전 학습 데이터와 모델 데이터를 결합한 보상 가중 로그가능도 objective 를 최소화하여 텍스트-이미지 모델을 미세조정한다.
  • 학습된 보상을 바탕으로 상위 출력을 선택하기 위해 거절 샘플링을 옵션으로 활용한다.
  • 인간 판단 및 표준 지표(FID)로 평가하여 정합성과 충실도, 보이지 않는 프롬프트에 대한 일반화를 연구한다.

실험 결과

연구 질문

  • RQ1인간 피드백이 확산 기반 텍스트-이미지 모델에서 이미지-텍스트 정합성 향상을 위한 미세조정을 효과적으로 이끌 수 있는가?
  • RQ2인간 판단으로 학습된 보상 모델이 정합성에 대한 CLIP 기반 척도보다 인간 선호도와 더 높은 상관성을 보이는가?
  • RQ3보조 손실 및 데이터 다양성 전략이 보상 학습과 보이지 않는 프롬프트에 대한 일반화를 개선하는가?
  • RQ4보상 가중 미세조정이 이미지 충실도에 어떤 영향을 미치는가, 또한 거절 샘플링이 정합성 향상을 증대시키는가?

주요 결과

CategoryTotal # of imagesGoodBadSkip
Count648034.461.04.6
Color348070.420.88.8
Background240066.933.10.0
Combination1516835.859.94.3
  • 인간 피드백으로의 미세조정이 원 모델 대비 이미지-텍스트 정합성을 크게 향상시키며, 인간 평가에서 최대 47%의 정합성 개선을 달성했다.
  • 학습된 보상 함수가 테스트된 프롬프트에서 CLIP 점수보다 인간 평가와의 정합성이 더 잘 일치한다.
  • 보조 프롬프트 분류 손실 및 데이터 다양성 전략이 보상의 일반화를 향상시켜 보이지 않는 프롬프트 및 객체에 대한 정합성을 개선한다.
  • 학습된 보상에 기반한 거절 샘플링은 추가 모델 학습 없이도 정합성을 더 개선하지만 추론 비용을 증가시킨다.
  • 다양한 데이터 없이의 naive 미세조정은 정합도는 높아져도 이미지 충실도 감소를 초래할 수 있어 정합성-충실도 간의 트레이드오프를 강조한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.