Skip to main content
QUICK REVIEW

[論文レビュー] Deep Learning for Hate Speech Detection: A Comparative Study

Jitendra Singh Malik, Qiao, Hezhe|arXiv (Cornell University)|Feb 19, 2022
Hate Speech and Cyberbullying Detection被引用数 37
ひとこと要約

本論文は、3つの公開ベンチマークにまたがる14個の浅層/深層ヘイトスピーチ検出器を大規模に実証比較し、効果、効率、事前学習の影響、およびドメイン横断一般化を評価する。

ABSTRACT

Automated hate speech detection is an important tool in combating the spread of hate speech, particularly in social media. Numerous methods have been developed for the task, including a recent proliferation of deep-learning based approaches. A variety of datasets have also been developed, exemplifying various manifestations of the hate-speech detection problem. We present here a large-scale empirical comparison of deep and shallow hate-speech detection methods, mediated through the three most commonly used datasets. Our goal is to illuminate progress in the area, and identify strengths and weaknesses in the current state-of-the-art. We particularly focus our analysis on measures of practical performance, including detection accuracy, computational efficiency, capability in using pre-trained models, and domain generalization. In doing so we aim to provide guidance as to the use of hate-speech detection in practice, quantify the state-of-the-art, and identify future research directions. Code and dataset are available at https://github.com/jmjmalik22/Hate-Speech-Detection.

研究の動機と目的

  • 多様なデータセットにおいて、さまざまなヘイトスピーチ検出モデルの性能を評価する。
  • 精度と効率の間で有利なトレードオフを提供するモデルを特定する。
  • 検出器の性能に対する事前学習方法の影響を評価する。
  • ヘイトスピーチ検出器に対するドメインシフトの影響を理解するため、ドメイン横断一般化を検討する。

提案手法

  • 検出器を浅層の従来法、単語埋め込みを用いた深層法、変換器ベースの深層法に分類する。
  • TF-IDF、GloVe埋め込み、およびtransformerベースの埋め込み(BERT、ALBERT、ELECTRA など)を用いて14 detectorsを評価する。
  • 埋め込みと分類器(SVM、XGB、MLP、CNN、Bi-LSTM)を組み合わせ、マクロF1と加重F1を報告する。
  • 不均衡クラスを含む3データセット(Davidson、Founta、TSA)を使用し、クラス別指標を報告する。
  • エポック時間による計算効率を分析し、実用的なモデル-精度のトレードオフを特定する。

実験結果

リサーチクエスチョン

  • RQ1多様なベンチマークデータセットにおいて、人気のヘイトスピーチ検出器はどれくらい効果的か?
  • RQ2効果と効率の両方で、一般的に他を上回るモデルはあるか?
  • RQ3事前学習方法はヘイトスピーチ検出性能にどのように影響するか?
  • RQ4異なるヘイトスピーチの定義と分布を持つドメイン間で、モデルはどれだけ一般化できるか?

主な発見

  • Transformerベースの埋め込み(BERT、ALBERT、ELECTRA)は、データセット全体で一貫して最高のマクロF1および加重F1を達成する。
  • TF-IDFベースのXGBoostおよびTF-IDFベースのMLPも競争力がある場合があり、特にデータ量が多い、またはよりバランスの取れた部分で有利だが、一般にtransformersが性能で優位である。
  • Transformerモデルは訓練時間が長くなる。Small BERTはtransformersの中で最も効率的である。
  • 事前訓練済みの埋め込み(特にtransformerベース)は、非事前訓練またはTF-IDFのベースラインを3データセットすべてで上回る。
  • ドメイン間評価は、あるデータセットから別のデータセットへ転送した場合に一般化の低下を示すが、ELECTRA-CNNはしばしば堅牢な選択として高い性能を維持する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。