[論文レビュー] The Emerging Generative Artificial Intelligence Divide in the United States
Bing検索データを用いて、米国全体の郡レベルおよび州レベルでの ChatGPT への知識/関心のパターンを分析し、生成系AIツールの初期普及における教育主導のデジタル格差を示す。
The digital divide refers to disparities in access to and use of digital tooling across social and economic groups. This divide can reinforce marginalization both at the individual level and at the level of places, because persistent economic advantages accrue to places where new technologies are adopted early. To what extent are emerging generative artificial intelligence (AI) tools subject to these social and spatial divides? We leverage a large-scale search query database to characterize U.S. residents' knowledge of a novel generative AI tool, ChatGPT, during its first six months of release. We identify hotspots of higher-than-expected search volumes for ChatGPT in coastal metropolitan areas, while coldspots are evident in the American South, Appalachia, and the Midwest. Nationwide, counties with the highest rates of search have proportionally more educated and more economically advantaged populations, as well as proportionally more technology and finance-sector jobs in comparison with other counties or with the national average. Observed associations with race/ethnicity and urbanicity are attenuated in fully adjusted hierarchical models, but education emerges as the strongest positive predictor of generative AI awareness. In the absence of intervention, early differences in uptake show a potential to reinforce existing spatial and socioeconomic divides.
研究の動機と目的
- 新しい生成型AIツール(ChatGPT)に関する知識の空間的パターンを、米国全体で特徴づける。
- 郡レベルの社会経済的・人口統計的・産業要因がChatGPTへの関心とどのように関連するかを評価する。
- 混乱因子を調整した後、教育が関心の最も強い予測因子であるかを検証する。
- 別のデータソース(Google Trends)を用いて所見の頑健性を評価する。
- 新たに出現するAI格差を縮小するための政策・設計上の示唆を議論する。
提案手法
- ChatGPT関連検索を測定するため、ZIPコード、郡、州レベルに集計された、識別情報を取り除いた Bing検索クエリデータ(2022年12月–2023年5月)を使用する。
- HUD-USPSのクロスウォークを介してZIPコードを郡と結び付ける。ユニークユーザーが50未満のセルは抑制する。
- ChatGPT検索の州レベルおよび郡レベルの比率を計算し、Moran’s I および Getis-Ord G* の統計量で空間的クラスタリングを評価する。
- 郡の特徴をACS 2016–2020データ(教育、収入、農村性、人種/民族、産業構成)を用いて記述する。
- 総検索数をオフセットとして、州のランダム効果と連続する共変量ブロックを含む多層ネガティブビノミアルモデルを適合させ、ChatGPT検索件数を予測する。
- Google Trendsデータと大都市圏分析を用いて頑健性チェックを実施し、残差の空間自己相関を検定する。

実験結果
リサーチクエスチョン
- RQ1リリース後の最初の6か月間における米国の州および郡におけるChatGPTへの関心の地理的分布はどうか。
- RQ2郡レベルの社会経済的・人口統計的・産業要因のうち、ChatGPT検索率の高いものは何か。
- RQ3他の要因を調整した後、教育が関心の最も強い予測因子として現れるか。
- RQ4観察されたパターンは、代替データソースや空間集約レベルに対して頑健か。
- RQ5これらの知見は、より広いデジタルデバイドのパターンや政策上の示唆とどう関連するか。
主な発見
- ChatGPTへの関心は空間的にクラスタリングされており、西海岸が最も高い検索率を示し、アパラチア地域/湾岸諸州が最も低い。
- 検索率が高い郡は、より都市的で、教育水準が高く、裕福で、アジア系人口が多く、技術/創造産業の雇用が多い傾向がある。
- 完全に調整された階層モデルでは、教育がChatGPT検索率の最も強い正の予測因子であり、他の社会経済的・人口統計的要因を上回る。
- Google Trendsを用いた頑健性チェックは、主な結論を支持する定性的に類似したパターンを生み出す。
- 結果は確立された第二段階のデジタル格差パターンと一致し、生成系AIツールの普及における新たな格差の出現を示唆する。

より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。