QUICK REVIEW

[논문 리뷰] Towards a more efficient bias detection in financial language models

Firas Hadj Kacem, Ahmed Khanfir|arXiv (Cornell University)|2026. 03. 09.

Stock Market Forecasting Methods인용 수 0

한 줄 요약

이 논문은 실제 금융 문장 데이터셋을 사용해 다섯 개의 금융 언어 모델의 편향을 분석하고, 공유된 편향 패턴을 보이며 비용 절감을 위한 교차 모델 가이드 편향 탐지를 제안한다.

ABSTRACT

Bias in financial language models constitutes a major obstacle to their adoption in real-world applications. Detecting such bias is challenging, as it requires identifying inputs whose predictions change when varying properties unrelated to the decision, such as demographic attributes. Existing approaches typically rely on exhaustive mutation and pairwise prediction analysis over large corpora, which is effective but computationally expensive-particularly for large language models and can become impractical in continuous retraining and releasing processes. Aiming at reducing this cost, we conduct a large-scale study of bias in five financial language models, examining similarities in their bias tendencies across protected attributes and exploring cross-model-guided bias detection to identify bias-revealing inputs earlier. Our study uses approximately 17k real financial news sentences, mutated to construct over 125k original-mutant pairs. Results show that all models exhibit bias under both atomic (0.58\%-6.05\%) and intersectional (0.75\%-5.97\%) settings. Moreover, we observe consistent patterns in bias-revealing inputs across models, enabling substantial reuse and cost reduction in bias detection. For example, up to 73\% of FinMA's biased behaviours can be uncovered using only 20\% of the input pairs when guided by properties derived from DistilRoBERTa outputs.

연구 동기 및 목표

실제 금융 문장을 보호 속성으로 변형한 데이터를 사용하여 다섯 개의 금융 언어 모델(생성 계열 두 개, 인코더 계열 세 개)의 편향을 평가한다.
편향-을 드러내는 입력이 모델 간에 공유되고 재사용될 수 있는지 탐구한다.
계산 및 추론 비용을 줄이기 위한 교차 모델 가이드 편향 탐지를 평가한다.
성별, 인종, 신체 속성에 걸친 원자적 편향과 교차적 편향을 정량화한다.
금융 NLP 배포에서 편향 감사의 속도를 높이기 위한 실용적인 전략을 식별한다.

제안 방법

원자적 및 교차 속성 변화를 수행하기 위해 HInter를 사용해 실제 금융 문장을 변형한다.
다섯 개 모델(FinMA, FinGPT, FinBERT, DeBERTa-v3, DistilRoBERTa)에서 원본 및 변형 입력에 대한 감성 예측을 수행한다.
원본과 변형 입력이 다른 감정 라벨을 갖는 경우 편향을 탐지한다.
편향 탐지 비율을 계산하고 모델 간 편향을 드러내는 입력의 중복을 분석한다.
Jensen–Shannon 거리와 코사인 유사도로 예측 변화(비전환 편향 포함)를 측정한다.
다른 모델의 예측에 기반해 입력의 우선순위를 매겨 교차 모델 가이드 편향 탐지를 평가하고, 이를 무작위 입력 순서와 비교한다.

실험 결과

연구 질문

RQ1금융 언어 모델은 보호 속성(성별, 인종, 신체)에 걸쳐 원자적 및 교차적 편향을 보이는가?
RQ2편향을 드러내는 입력이 모델 간에 공유되어 편향 탐지를 위한 입력 재사용이 가능한가?
RQ3경량 모델을 활용한 교차 모델 가이드가 대형 모델의 신뢰성을 해치지 않으면서 편향 탐지를 가속화할 수 있는가?

주요 결과

모델	원자적(신체)	교차적(신체)	원자적(성별)	교차적(성별)	원자적(인종)	교차적(인종)	총계(원자적)	총계(교차)	총계숨김(교차)
FinMA	9.23%	7.48%	2.77%	2.25%	3.25%	3.29%	3.99%	3.23%	4.05%
FinGPT	5.39%	2.77%	6.10%	6.55%	6.13%	6.07%	6.05%	5.97%	31.29%
FinBERT	1.89%	1.88%	0.69%	0.88%	0.25%	0.41%	0.58%	0.75%	30.34%
DeBERTa-v3	1.69%	1.67%	0.70%	0.89%	0.30%	0.46%	0.60%	0.75%	29.95%
DistilRoBERTa	1.69%	1.67%	0.70%	0.89%	0.30%	0.46%	0.60%	0.75%	29.95%

다섯 개 모델 모두 원자적 및 교차적 설정에서 편향을 보이며 크기에 차이가 있다.
경량 모델은 원자적 및 교차적 설정에서 대형 모델보다 전반적으로 편향이 더 낮다.
편향을 드러내는 입력의 중복은 분류 모델들 사이에서 높게 나타나(공유 비율 94% 이상) 분류기와 생성기 간에는 낮다.
경량 모델의 예측으로 가이드되는 교차 모델 편향 탐지는 제한된 입력으로도 대형 모델의 편향의 큰 비율을 발견할 수 있다(예: FinMA 편향의 73%가 입력의 20%로 발견됨).
편향을 드러내는 입력은 비편향 입력보다 더 큰 예측 변화(JSD 증가)를 유발하는 경향이 있어, 교차 모델 우선순위 전략을 뒷받침한다.
결과는 유사한 모델 군에서 편향 입력의 재사용이 감사 비용을 줄이는 데 도움이 됨을 시사한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.