Skip to main content
QUICK REVIEW

[論文レビュー] Classification of Autistic and Non-Autistic Children's Speech: A Cross-Linguistic Study in Finnish, French, and Slovak

Sofoklis Kakouros, Ida-Lotta Myllylä|arXiv (Cornell University)|Mar 6, 2026
Autism Spectrum Disorder Research被引用数 0
ひとこと要約

要約: 本研究は単純な音響-韻律分類器(88個のopenSMILE特徴量)を訓練し、フィンランド語、フランス語、スロバキア語の ASD と TD 音声を識別。言語内の性能と、プールされた多言語・LOCO設定での言語間一般化を評価します。

ABSTRACT

We present a cross-linguistic study of speech in autistic and non-autistic children speaking Finnish, French, and Slovak. We combine supervised classification with within-language and cross-corpus transfer experiments to evaluate classification performance within and across languages and to probe which acoustic cues are language-specific versus language-general. Using a large set of acoustic-prosodic features, we implement speaker-level classification benchmarks as an analytical tool rather than to seek state-of-the-art performance. Within-language models, evaluated with speaker-level cross-validation, yielded heterogeneous results. The Finnish model performed best (Accuracy 0.84, F1 0.88), followed by Slovak (Accuracy 0.63, F1 0.68) and French (Accuracy 0.68, F1 0.56). We then tested cross-language generalization. A model trained on all pooled corpora reached an overall Accuracy of 0.61 and F1 0.68. Leave-one-corpus-out experiments, which test transfer to an unseen language, showed moderate success when testing on Slovak (F1 0.70) and Finnish (F1 0.78), but poor transfer to French (F1 0.42). Feature-importance analyses across languages highlighted partially shared, but not fully language-invariant, acoustic markers of autism. These findings suggest that some autism-related speech cues generalize across typologically distinct languages, but robust cross-linguistic classifiers will likely require language-aware modeling and more homogeneous recording conditions.

研究の動機と目的

  • 三言語にまたがる韻律的特徴を用いて、言語内での ASD 対 TD の識別を評価する。
  • 一つ以上の言語で訓練されたモデルの言語横断一般化を評価する。
  • 特徴の重要度分析を通じて、言語一般的な音響-韻律マーカーと言語特異的マーカーを特定する。
  • 現実的な汎化推定を得るために話者レベルの交差検証を用いる。
  • 録音条件と言語が、跨言語のロバスト性にどのように影響するかを探る。

提案手法

  • 各 IPU について openSMILE eGeMAPS の発話レベル機能量で 88 次元の音響-韻律特徴を抽出する。
  • XGBoost および Random Forest の分類器を訓練し、話者レベルで ASD 対 TD を識別する。
  • 言語内での交差検証を実施し、言語依存の手掛かりを評価する。
  • プールされた多言語訓練と LOCO(leave-one-corpus-out)評価を用いた言語横断分析を実施する。
  • 木構造ベースの重要度指標、TreeSHAP、および置換重要度で特徴の重要度を分析する。
  • 言語特異的結果とプールされた結果を対比して、言語一般的な手掛かりを特定する。

実験結果

リサーチクエスチョン

  • RQ1各言語内で韻律特徴を用いて ASD と TD を識別できるか。
  • RQ2一つの言語で訓練されたモデルは、プールされたデータセットや LOCO 設定で他言語へどの程度一般化するか。
  • RQ3どの音響-韻律特徴が言語一般的なマーカーで、どれが言語特異的か。

主な発見

  • フィンランド語の言語内精度は 0.84、F1 は 0.88;スロバキア語の精度は 0.63、F1 は 0.68;フランス語の精度は 0.68、F1 は 0.56。
  • 跨言語のプールモデルは平均で精度 0.61、F1 0.68 を達成。
  • LOCO 移動はフィンランド語 F1 が 0.78、スロバキア語 F1 が 0.70 と比較的成功だが、フランス語 F1 は 0.42 のままで悪化。
  • 言語間では F0(ピッチ)の分布が ASD と TD を区別するのに一貫して有効;言語特異的手掛かりにはスペクトル傾斜、全体スペクトル形状、ダイナミクス、形成帯構造、強度が含まれる。
  • プールされた多言語分析は、ピッチとスペクトル形状を含む、言語一般的な手掛かりの共有セットを示す一方で、言語特有の強調は依然として顕著である。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。