QUICK REVIEW

[논문 리뷰] A BERT based Sentiment Analysis and Key Entity Detection Approach for Online Financial Texts

Lingyun Zhao, Lin Li|arXiv (Cornell University)|2020. 01. 14.

Sentiment Analysis and Opinion Mining참고 문헌 31인용 수 23

한 줄 요약

이 논문은 온라인 금융 텍스트에서 감성 분석 및 핵심 엔티티 탐지에 BERT 기반 접근법을 제안하며, 전통적인 NER가 아닌 문장 매칭 또는 기계적 독해 이해(reading comprehension) 작업으로 엔티티 탐지를 다룬다. 이 방법은 두 개의 금융 텍스트 데이터셋에서 SVM, LR, NBM 및 표준 BERT보다 뛰어난 성능을 기록하며, 앙상블 학습을 통해 부정 감성 및 핵심 엔티티 식별 성능을 향상시킨다.

ABSTRACT

The emergence and rapid progress of the Internet have brought ever-increasing impact on financial domain. How to rapidly and accurately mine the key information from the massive negative financial texts has become one of the key issues for investors and decision makers. Aiming at the issue, we propose a sentiment analysis and key entity detection approach based on BERT, which is applied in online financial text mining and public opinion analysis in social media. By using pre-train model, we first study sentiment analysis, and then we consider key entity detection as a sentence matching or Machine Reading Comprehension (MRC) task in different granularity. Among them, we mainly focus on negative sentimental information. We detect the specific entity by using our approach, which is different from traditional Named Entity Recognition (NER). In addition, we also use ensemble learning to improve the performance of proposed approach. Experimental results show that the performance of our approach is generally higher than SVM, LR, NBM, and BERT for two financial sentiment analysis and key entity detection datasets.

연구 동기 및 목표

거대한 규모의 부정적인 온라인 금융 텍스트에서 핵심 정보를 신속하고 정확하게 추출하는 데 도전하는 것.
금융 소셜 미디어 및 공공 여론 모니터링에서 감성 분석 및 핵심 엔티티 탐지 성능을 향상시키는 것.
핵심 엔티티 탐지를 전통적인 명명된 실체 인식(Named Entity Recognition, NER)과는 다름없이 문장 매칭 또는 기계적 독해 이해(MRC) 작업으로 재정의하는 혁신적인 접근법을 제안하는 것.
금융 텍스트 마이닝 응용 분야에서 성능을 향상시키기 위해 앙상블 학습 기법을 활용하는 것.

제안 방법

도메인 특화 데이터셋을 기반으로 사전 훈련된 BERT 모델을 금융 감성 분석에 맞게 미세 조정하는 것.
정확도 향상을 위해 핵심 엔티티 탐지를 문장 매칭 또는 기계적 독해 이해(MRC) 작업으로 재정의하는 것.
다양한 모델의 예측을 결합하기 위해 앙상블 학습을 사용하여 전체 성능을 향상시키는 것.
금융 맥락에서 더 높은 위험도와 의사결정 관련성이 있기 때문에 부정 감성 탐지에 집중하는 것.
금융 언어에서 감성과 엔티티 간의 미묘한 관계를 포괄적으로 포착하기 위해 BERT의 문맥적 표현을 활용하는 것.
사전 훈련된 BERT 모델을 초기화로 사용하고 금융 텍스트 데이터에 대해 미세 조정함으로써 전이 학습을 적용하는 것.

실험 결과

연구 질문

RQ1BERT 기반 모델은 온라인 금융 텍스트에서 감성을 효과적으로 탐지할 수 있는가, 특히 부정 감성에 대해?
RQ2핵심 엔티티 탐지를 전통적인 NER가 아닌 문장 매칭 또는 MRC 작업으로 다룰 경우, 금융 텍스트 분석에서 어떤 차이를 보이는가?
RQ3앙상블 학습이 금융 감성 및 엔티티 탐지 작업의 성능 향상에 어느 정도 기여하는가?
RQ4제안된 접근법이 SVM, LR, NBM와 같은 전통적 모델보다 금융 텍스트 데이터셋에서 더 나은 성능을 내는가?

주요 결과

제안된 BERT 기반 접근법은 두 개의 금융 감성 분석 및 핵심 엔티티 탐지 데이터셋에서 SVM, LR, NBM 및 표준 BERT보다 높은 성능을 기록한다.
이 방법은 위험 평가에 핵심적인 역할을 하는 부정적인 금융 텍스트에서 핵심 엔티티를 탐지하는 데 뛰어난 정확도를 보인다.
엔티티 탐지를 문장 매칭 또는 MRC 작업으로 재정의함으로써 기존 NER 접근법 대비 정밀도 향상이 이루어진다.
앙상블 학습은 감성 및 엔티티 탐지 파이프라인의 강건성과 성능을 크게 향상시킨다.
특히 감성 어휘를 지닌 엔티티를 식별하는 데 있어 도메인 특화 금융 언어에서 뛰어난 일반화 능력을 보인다.
실시간 공공 여론 분석 및 금융 시장에서의 의사결정 지원에 효과적이다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.