Skip to main content
QUICK REVIEW

[논문 리뷰] KC-GenRe: A Knowledge-constrained Generative Re-ranking Method Based on Large Language Models for Knowledge Graph Completion

Yilin Wang, Minghao Hu|arXiv (Cornell University)|2024. 03. 26.
Advanced Graph Neural Networks인용 수 6
한 줄 요약

KC-GenRe는 지식 제약을 갖춘 생성적 LLM 접근법을 사용하여 상위-K KG 완료 후보를 재순위화하고, 불일치, 잘못된 순서 지정, 누락을 해결하며, 네 개 데이터셋에서 최첨단 성과를 달성한다.

ABSTRACT

The goal of knowledge graph completion (KGC) is to predict missing facts among entities. Previous methods for KGC re-ranking are mostly built on non-generative language models to obtain the probability of each candidate. Recently, generative large language models (LLMs) have shown outstanding performance on several tasks such as information extraction and dialog systems. Leveraging them for KGC re-ranking is beneficial for leveraging the extensive pre-trained knowledge and powerful generative capabilities. However, it may encounter new problems when accomplishing the task, namely mismatch, misordering and omission. To this end, we introduce KC-GenRe, a knowledge-constrained generative re-ranking method based on LLMs for KGC. To overcome the mismatch issue, we formulate the KGC re-ranking task as a candidate identifier sorting generation problem implemented by generative LLMs. To tackle the misordering issue, we develop a knowledge-guided interactive training method that enhances the identification and ranking of candidates. To address the omission issue, we design a knowledge-augmented constrained inference method that enables contextual prompting and controlled generation, so as to obtain valid rankings. Experimental results show that KG-GenRe achieves state-of-the-art performance on four datasets, with gains of up to 6.7% and 7.7% in the MRR and Hits@1 metric compared to previous methods, and 9.0% and 11.1% compared to that without re-ranking. Extensive analysis demonstrates the effectiveness of components in KG-GenRe.

연구 동기 및 목표

  • 동기: 지식 그래프는 종종 불완전하며, 보완 품질을 향상시키기 위해 후보 꼬리 엔티티의 효과적인 재순위가 필요하다.
  • 목표: (i) 정확한 텍스트 매칭(불일치)을 피하고, (ii) 적절한 후보 순서를 학습하며, (iii) 모든 후보를 고려하도록 생성적 LLM 기반 재순위 방법을 개발한다.
  • 목표: 1단계 KG 임베딩을 활용해 순위를 안내하고, 맥락 정보를 검색하여 타당한 순위를 위한 생성을 제약한다.

제안 방법

  • 재순위화를 후보 이름이 아닌 후보 옵션 식별자의 정렬된 시퀀스로 출력하도록 공식화하여 불일치를 피한다.
  • 쿼리-후보 및 후보-후보 상호작용을 통한 지식 가이드형 대화식 학습을 도입하여 후보의 타당성과 상대적 순서를 학습하고, LLM 출력과 1단계 점수를 정렬시키는 손실을 사용한다.
  • 쿼리 관련 프롬프트와 후보 지원 프롬프트를 포함한 지식 보강 제약 추론과 완전하고 타당한 순위를 보장하는 제약된 옵션 생성을 제안한다.
  • KC-GenRe 프레임워크에서 QLORA를 통해 LLaMA-7b를 미세조정하고, 1단계 KGE 모델의 상위-K 후보와 입력/출력 형식을 위한 지시 템플릿을 사용한다.

실험 결과

연구 질문

  • RQ1생성적 LLM을 지식 그래프 보완 후보 재순위화에 효과적으로 활용하여 생성 텍스트와 KG 엔티티 간의 불일치를 완화할 수 있는가?
  • RQ2지식 가이드형 학습 및 지식 보강 추론이 LLM 기반의 KGC 재순위화의 안정성과 품질을 향상시킬 수 있는가?
  • RQ3LLM 출력이 후보 옵션 식별자로 제약되고 맥락 프롬프트를 활용하는 것이 순위 정확도와 타당성을 향상시키는가?

주요 결과

모델Wiki27K MRRWiki27K Hits@1Wiki27K Hits@3Wiki27K Hits@10FB15K-237-N MRRFB15K-237-N Hits@1FB15K-237-N Hits@3FB15K-237-N Hits@10
TransE †0.1550.0320.2280.3780.2550.1520.3010.459
TransC †0.1750.1240.2150.3390.2330.1290.2980.395
ConvE †0.2260.1640.2440.3540.2730.1920.3050.429
WWV †0.1980.1570.2370.3650.2690.1370.2870.443
TuckER Balazevic et al.0.2490.1850.2690.3850.3090.2270.3400.474
RotatE Sun et al.0.2160.1230.2560.3940.2790.1770.3200.481
KG-BERT Yao et al.0.1920.1190.2190.3520.2030.1390.2010.403
PKGC Lv et al.0.2850.2300.3050.4090.3320.2610.3460.487
KC-GenRe0.3170.2740.3300.4080.3990.3380.4270.505
  • KC-GenRe는 네 개 데이터셋에서 최적의 재순위 성능을 달성했으며, 큐레이션된 데이터에서 이전 방법 대비 MRR에서 최대 6.7% 절대 증가, Hits@1에서 7.7% 증가를 나타냈다.
  • 개방형 KG 데이터셋에서 KC-GenRe는 베이스라인 대비 MRR에서 2.1–3.5%, Hits@1에서 2.1–3.8%의 향상을 보였다.
  • 애블레이션 연구에서 쿼리-후보 상호작용과 후보-후보 상호작용이 성능을 크게 향상시키며, 쿼리 관련 프롬프트와 후보 지원 프롬프트의 조합이 최상의 결과를 낳는 것으로 나타났다.
  • 제한된 옵션 생성은 결정적으로 중요하며, 이를 제거하면 성능이 저하되어 후보 집합과의 정렬을 맞추는 것이 필요함을 시사한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.