Skip to main content
QUICK REVIEW

[논문 리뷰] LabelPrompt: Effective Prompt-based Learning for Relation Classification

Wenjie Zhang, Xiaoning Song|arXiv (Cornell University)|2023. 02. 16.
Topic Modeling인용 수 7
한 줄 요약

LabelPrompt은 레이블 토큰과 엔티티 의식적 주의 전략 프레임워크를 도입하여 특히 few-shot 설정에서 프롬프트 기반 관계 분류를 개선합니다.

ABSTRACT

Recently, prompt-based learning has gained popularity across many natural language processing (NLP) tasks by reformulating them into a cloze-style format to better align pre-trained language models (PLMs) with downstream tasks. However, applying this approach to relation classification poses unique challenges. Specifically, associating natural language words that fill the masked token with semantic relation labels ( extit{e.g.} extit{``org:founded\_by}'') is difficult. To address this challenge, this paper presents a novel prompt-based learning method, namely LabelPrompt, for the relation classification task. Motivated by the intuition to ``GIVE MODEL CHOICES!'', we first define additional tokens to represent relation labels, which regard these tokens as the verbaliser with semantic initialisation and explicitly construct them with a prompt template method. Then, to mitigate inconsistency between predicted relations and given entities, we implement an entity-aware module with contrastive learning. Last, we conduct an attention query strategy within the self-attention layer to differentiates prompt tokens and sequence tokens. Together, these strategies enhance the adaptability of prompt-based learning, especially when only small labelled datasets is available. Comprehensive experiments on benchmark datasets demonstrate the superiority of our method, particularly in the few-shot scenario.

연구 동기 및 목표

  • 프리트레이닝 목표와 관계 분류 작업 간의 간극을 메우다.
  • 프롬프트 기반 학습이 단일 단어 어휘 항목을 넘어 복잡한 관계 레이블을 다룰 수 있도록 한다.
  • 주어진 엔티티와 예측된 관계 간의 불일치를 엔티티 인식 모듈을 통해 완화한다.
  • 레이블 프롬프트를 활용하되 프롬프트 토큰과 문장 토큰을 구별하여 문장 의미를 보존한다.
  • 표준 RC 벤치마크에서 few-shot 및 전체 데이터 설정에서 강력한 성능 향상을 입증한다.

제안 방법

  • 의미 라벨 텍스트로부터 초기화된 관계 레이블 토큰으로 어휘를 확장한다.
  • 주체와 목적 엔티티 옆에 레이블 토큰을 직접 입력에 삽입하는 프롬프트 템플릿을 사용한다.
  • 모델 헤드에서 레이블 토큰의 의미 의미를 강화하는 관계 정합 모듈을 도입한다.
  • 엔티티-관계 삼중항에 대한 대비 손실을 사용하여 예측을 엔티티 맥락에 근거시키는 엔티티 인식 모듈을 추가한다.
  • self-attention에서 프롬프트-프롬프트, 프롬프트-문장, 문장-프롬프트, 문장-문장 상호작용에 대해 별도의 쿼리 매핑을 사용하도록 주의(attention) 질의 전략을 채택한다.

실험 결과

연구 질문

  • RQ1라벨 토큰과 프롬프트 템플릿을 어떻게 설계하면 마스킹된 출력이 복잡한 관계 레이블에 더 잘 매핑될 수 있나?
  • RQ2특정 엔티티 페어 간 관계 이해를 향상시키는 엔티티 인식 대비 학습 신호가 가능한가?
  • RQ3맞춤형 주의(attention)를 통해 프롬프트 토큰과 문장 토큰을 구분하는 것이 데이터가 제한적일 때 RC 성능을 향상시키는가?
  • RQ4표준 벤치마크에서 파인튜닝 및 기존 프롬프트 기반 RC 방법과 비교한 LabelPrompt의 이점은 무엇인가?

주요 결과

k샷방법TACREDTACREVReTACREDSemEval
8Fine-tuning12.213.528.541.3
8GDPNet11.812.329.042.0
8PTR28.128.751.570.5
8KnowPrompt32.032.155.374.3
8LabelPrompt33.934.861.577.0
16Fine-tuning21.522.349.565.2
16GDPNet22.523.850.067.5
16PTR30.731.456.281.3
16KnowPrompt35.433.163.382.9
16LabelPrompt34.435.464.581.7
32Fine-tuning28.028.256.080.1
32GDPNet28.829.156.581.2
32PTR32.132.462.184.2
32KnowPrompt36.534.765.084.8
32LabelPrompt35.436.866.784.6
  • LabelPrompt는 TACRED, TACREV, ReTACRED, SemEval에서 few-shot 설정에서 baselines보다 더 높은 마이크로 F1을 달성한다.
  • 8샷, 16샷, 32샷 시나리오에서 LabelPrompt는 이전 프롬프트 기반 방법을 능가하고 종종 파인튜닝 베이스라인보다 여러 데이터셋에서 성능이 우수하다.
  • LabelPrompt는 few-shot 및 전체 데이터 평가에서 KnowPrompt와 PTR에 비해 일관되게 성능을 향상시킨다.
  • 추가 데이터 없이 전체 데이터에서 LabelPrompt는 TACRED 73.1, TACREV 82.5, ReTACRED 91.6, SemEval 91.3를 달성하여 여러 베이스라인을 능가한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.