QUICK REVIEW

[논문 리뷰] KBGAN: Adversarial Learning for Knowledge Graph Embeddings

Liwei Cai, William Yang Wang|arXiv (Cornell University)|2017. 11. 11.

Advanced Graph Neural Networks참고 문헌 22인용 수 44

한 줄 요약

KBGAN은 지식 그래프 임bedding 모델의 성능을 햖스르기 위해 확률 기반 모델을 생성기로 사용해 고품질의 음성 훈련 샘플을 생성하고, 거리 기반 모델을 디스criminator로 사용하는 새로운 적대적 학습 프레임워크를 제안한다. 이 방법은 외부 온톨로지가 필요 없이 여러 데이터셋에서 링크 예측 작업의 성능을 크게 향상시킨다.

ABSTRACT

We introduce KBGAN, an adversarial learning framework to improve the performances of a wide range of existing knowledge graph embedding models. Because knowledge graphs typically only contain positive facts, sampling useful negative training examples is a non-trivial task. Replacing the head or tail entity of a fact with a uniformly randomly selected entity is a conventional method for generating negative facts, but the majority of the generated negative facts can be easily discriminated from positive facts, and will contribute little towards the training. Inspired by generative adversarial networks (GANs), we use one knowledge graph embedding model as a negative sample generator to assist the training of our desired model, which acts as the discriminator in GANs. This framework is independent of the concrete form of generator and discriminator, and therefore can utilize a wide variety of knowledge graph embedding models as its building blocks. In experiments, we adversarially train two translation-based models, TransE and TransD, each with assistance from one of the two probability-based models, DistMult and ComplEx. We evaluate the performances of KBGAN on the link prediction task, using three knowledge base completion datasets: FB15k-237, WN18 and WN18RR. Experimental results show that adversarial training substantially improves the performances of target embedding models under various settings.

연구 동기 및 목표

지식 그래프 임베딩에서 균일한 무작위 음성 샘플이 종종 긍정 샘플과 쉽게 구별될 수 있는 문제를 해결하기 위해.
더 나은 음성 예시를 사용한 적대적 학습을 통해 기존 지식 그래프 임베딩 모델의 일반화 능력과 성능을 향상시키기 위해.
외부 제약 조건이 필요 없이 어떤 지식 그래프 임베딩 모델도 생성기 또는 디스criminator로 통합할 수 있는 일반적이고 모델에 종속되지 않는 프레임워크를 설계하기 위해.
분산된 생성 설정에서 기울기 기반 최적화를 가능하게 하기 위해 분산된 강화 학습 방법을 사용하고 분산을 줄이는 기법을 적용하기 위해.

제안 방법

KBGAN은 생성적 적대적 네트워크(GAN)의 영감을 받은 프레임워크를 사용하며, 한 KGE 모델이 음성 사실을 생성하는 생성기로 작동하고, 다른 모델이 진짜와 생성된 음성 샘플을 구별하는 디스criminator로 작동한다.
생성기는 학습된 임베딩 기반으로 잠재적인 음성 삼중항을 점수 매기는 확률 기반 모델(예: DistMult 또는 ComplEx)이다.
디스criminator는 마진 손실 기반 모델(예: TransE 또는 TransD)로, 진짜 사실과 생성된 음성 샘플을 분류하는 데 학습한다.
생성기의 이산적 샘플링 단계를 통해 기울기를 역전파하기 위해 일단의 REINFORCE 알고리즘과 분산 감소 기법을 사용한다.
프레임워크는 엔드 투 엔드로 훈련되며, 생성기가 시간이 지남에 따라 디스criminator를 더 잘 도전할 수 있는 더 현실적인 음성 샘플을 생성하도록 향상된다.
훈련 안정성과 성능를 균형 잡기 위해 음성 샘플 수(예: Ns)와 같은 하이퍼파ram터가 조정된다.

실험 결과

연구 질문

RQ1학습된 생성기를 사용한 적대적 학습이 균일한 무작위 샘플링보다 더 높은 품질의 음성 샘플을 생성할 수 있는가?
RQ2제안된 KBGAN 프레임워크는 다양한 지식 그래프 임베딩 모델과 여러 데이터셋에서 일관되게 성능을 향상시키는가?
RQ3생성된 음성 샘플의 품질이 디스criminator의 링크 예측 작업에서의 일반화 능력에 어떤 영향을 미치는가?
RQ4프레임워크는 아키텍처 수정이나 외부 온톨로지 없이 다양한 KGE 모델에 적용될 수 있는가?

주요 결과

KBGAN은 FB15k-237, WN18, WN18RR 세 가지 벤치마크 데이터셋에서 TransE와 TransD 모두의 성능을 일관되게 향상시켰다.
적대적 학습 설정은 모든 설정에서 평균 역수 순위(MRR)와 hits@10에서 뚜렷한 향상을 이끌었으며, WN18RR와 같은 도전적인 데이터셋에서도 개선 효과를 보였다.
모델에서 생성된 음성 샘플은 균일한 무작위 음성 샘플보다 의미적으로 더 관련성이 있으며, 엔티티가 약하지만 설득력 있는 의미 관계를 보이는 질적 사례 연구를 통해 이를 입증했다.
검증 세트에서 훈련 과정이 안정적이고 단조롭게 향상되는 것으로 나타나, GAN의 본질적 불안정성에도 불구하고 수렴을 보였다.
더 단순한 모델인 TransE와 TransD를 디스criminator로 사용할 때도 프레임워크가 효과를 유지함으로써 기존 KGE 아키텍처와의 광범위한 호환성을 보였다.
일단의 REINFORCE 방법을 사용함으로써 이산 생성기에서 효과적인 역전파가 가능해져 엔드 투 엔드 훈련이 가능해졌다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.