[論文レビュー] Classification of Autistic and Non-Autistic Children's Speech: A Cross-Linguistic Study in Finnish, French, and Slovak
要約: 本研究は単純な音響-韻律分類器(88個のopenSMILE特徴量)を訓練し、フィンランド語、フランス語、スロバキア語の ASD と TD 音声を識別。言語内の性能と、プールされた多言語・LOCO設定での言語間一般化を評価します。
We present a cross-linguistic study of speech in autistic and non-autistic children speaking Finnish, French, and Slovak. We combine supervised classification with within-language and cross-corpus transfer experiments to evaluate classification performance within and across languages and to probe which acoustic cues are language-specific versus language-general. Using a large set of acoustic-prosodic features, we implement speaker-level classification benchmarks as an analytical tool rather than to seek state-of-the-art performance. Within-language models, evaluated with speaker-level cross-validation, yielded heterogeneous results. The Finnish model performed best (Accuracy 0.84, F1 0.88), followed by Slovak (Accuracy 0.63, F1 0.68) and French (Accuracy 0.68, F1 0.56). We then tested cross-language generalization. A model trained on all pooled corpora reached an overall Accuracy of 0.61 and F1 0.68. Leave-one-corpus-out experiments, which test transfer to an unseen language, showed moderate success when testing on Slovak (F1 0.70) and Finnish (F1 0.78), but poor transfer to French (F1 0.42). Feature-importance analyses across languages highlighted partially shared, but not fully language-invariant, acoustic markers of autism. These findings suggest that some autism-related speech cues generalize across typologically distinct languages, but robust cross-linguistic classifiers will likely require language-aware modeling and more homogeneous recording conditions.
研究の動機と目的
- 三言語にまたがる韻律的特徴を用いて、言語内での ASD 対 TD の識別を評価する。
- 一つ以上の言語で訓練されたモデルの言語横断一般化を評価する。
- 特徴の重要度分析を通じて、言語一般的な音響-韻律マーカーと言語特異的マーカーを特定する。
- 現実的な汎化推定を得るために話者レベルの交差検証を用いる。
- 録音条件と言語が、跨言語のロバスト性にどのように影響するかを探る。
提案手法
- 各 IPU について openSMILE eGeMAPS の発話レベル機能量で 88 次元の音響-韻律特徴を抽出する。
- XGBoost および Random Forest の分類器を訓練し、話者レベルで ASD 対 TD を識別する。
- 言語内での交差検証を実施し、言語依存の手掛かりを評価する。
- プールされた多言語訓練と LOCO(leave-one-corpus-out)評価を用いた言語横断分析を実施する。
- 木構造ベースの重要度指標、TreeSHAP、および置換重要度で特徴の重要度を分析する。
- 言語特異的結果とプールされた結果を対比して、言語一般的な手掛かりを特定する。
実験結果
リサーチクエスチョン
- RQ1各言語内で韻律特徴を用いて ASD と TD を識別できるか。
- RQ2一つの言語で訓練されたモデルは、プールされたデータセットや LOCO 設定で他言語へどの程度一般化するか。
- RQ3どの音響-韻律特徴が言語一般的なマーカーで、どれが言語特異的か。
主な発見
- フィンランド語の言語内精度は 0.84、F1 は 0.88;スロバキア語の精度は 0.63、F1 は 0.68;フランス語の精度は 0.68、F1 は 0.56。
- 跨言語のプールモデルは平均で精度 0.61、F1 0.68 を達成。
- LOCO 移動はフィンランド語 F1 が 0.78、スロバキア語 F1 が 0.70 と比較的成功だが、フランス語 F1 は 0.42 のままで悪化。
- 言語間では F0(ピッチ)の分布が ASD と TD を区別するのに一貫して有効;言語特異的手掛かりにはスペクトル傾斜、全体スペクトル形状、ダイナミクス、形成帯構造、強度が含まれる。
- プールされた多言語分析は、ピッチとスペクトル形状を含む、言語一般的な手掛かりの共有セットを示す一方で、言語特有の強調は依然として顕著である。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。