QUICK REVIEW

[논문 리뷰] WT5?! Training Text-to-Text Models to Explain their Predictions

Sharan Narang, Colin Raffel|arXiv (Cornell University)|2020. 04. 30.

Topic Modeling참고 문헌 54인용 수 103

한 줄 요약

이 논문은 텍스트-투-텍스트 모델을 훈련시켜 예측과 함께 자연어 설명을 생성하도록 하며, 최첨단 설명 가능성을 달성하고 학습 손실을 바꾸지 않고 반감독 및 교차 도메인 전이 가능하게 한다.

ABSTRACT

Neural networks have recently achieved human-level performance on various challenging natural language processing (NLP) tasks, but it is notoriously difficult to understand why a neural network produced a particular prediction. In this paper, we leverage the text-to-text framework proposed by Raffel et al.(2019) to train language models to output a natural text explanation alongside their prediction. Crucially, this requires no modifications to the loss function or training and decoding procedures -- we simply train the model to output the explanation after generating the (natural text) prediction. We show that this approach not only obtains state-of-the-art results on explainability benchmarks, but also permits learning from a limited set of labeled explanations and transferring rationalization abilities across datasets. To facilitate reproducibility and future work, we release our code use to train the models.

연구 동기 및 목표

신경 예측을 해석 가능하게 만들려는 동기를 부여하고, 자연어 설명을 가능하게 한다.
학습 또는 디코딩 절차를 변경하지 않고도 설명을 출력하도록 모델을 학습시키기 위해 텍스트-투-텍스트 프레임워크를 활용한다.
여러 NLP 과제에 걸친 설명 가능성 벤치마크에서 최첨단 성능을 보여준다.
설명 능력의 반지도 학습, 교차 도메인 및 교차 작업 전이를 탐구한다.

제안 방법

기본 모델로 Text-to-Text Transfer Transformer (T5)를 사용하고, 자연어 설명을 포함한 분류를 위해 미세조정한다.
필요에 따라 입력 앞에 토큰 explain 를 접두사로 추가하여 출력에 동반 설명을 생성한다.
설명 있음 예시와 설명 없음 예시를 혼합된 목표로 학습하여 반지도 학습을 가능하게 한다.
선택적으로 입력 구간에 정렬될 수 있는 설명 구간을 출력하도록 모델을 학습시켜 추출적 설명을 지원한다.
추상적 설명은 BLEU로, 추출적 설명은 토큰화된 입력 구간에 대한 F1으로 평가하고, Mechanical Turk를 통한 인간 판단으로 보완한다.

실험 결과

연구 질문

RQ1손실 객체를 수정하지 않고도 하나의 텍스트-투-텍스트 모델이 예측에 대한 일관된 자연어 설명을 생성할 수 있는가?
RQ2설명을 포함하는 것이 데이터세트 전반에서 예측 정확도와 설명 품질에 어떤 영향을 미치는가?
RQ3설명이 데이터의 일부에만 제공되는 반지도 학습의 효과는 무엇인가?
RQ4명시적 설명 주석 없이도 도메인 및 작업 간 설명 능력이 어느 정도 전이될 수 있는가?

주요 결과

WT5-11B는 데이터세트 전반에서 높은 정확도와 경쟁력 있는 설명 품질을 달성하며, 예측과 설명 모두에서 자주 기존 최첨단과 일치하거나 이를 능가한다.
모델은 여러 데이터세트에서 인간 판단으로 측정한 설명 품질 면에서 인간 수준 또는 인간을 능가하는 수준에 도달한다.
설명 생성은 제한된 주석 설명으로 반지도 설정에서도 여전히 효과적이며, 특히 추상적 설명에서 그렇다.
교차 도메인 전이(MNLI, IMDb 등)는 높은 인간 평가 품질과 강한 분류 성능을 가진 타당한 설명을 산출한다.
적절한 입력 포맷과 빔 서치 디코딩으로 교차 작업 전이(e-SNLI에서 CoS-E)도 가능하며 합리적인 설명을 생성한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.