[論文レビュー] The Surveillance AI Pipeline
この論文は三十年分のコンピュータビジョン論文とダウンストリーム特許を分析し、AI研究が人間データの抽出を可能にし監視を促進する方法を明らかにし、研究と監視特許を結びつける分野全体の規範を示す。
A rapidly growing number of voices argue that AI research, and computer vision in particular, is powering mass surveillance. Yet the direct path from computer vision research to surveillance has remained obscured and difficult to assess. Here, we reveal the Surveillance AI pipeline by analyzing three decades of computer vision research papers and downstream patents, more than 40,000 documents. We find the large majority of annotated computer vision papers and patents self-report their technology enables extracting data about humans. Moreover, the majority of these technologies specifically enable extracting data about human bodies and body parts. We present both quantitative and rich qualitative analysis illuminating these practices of human data extraction. Studying the roots of this pipeline, we find that institutions that prolifically produce computer vision research, namely elite universities and "big tech" corporations, are subsequently cited in thousands of surveillance patents. Further, we find consistent evidence against the narrative that only these few rogue entities are contributing to surveillance. Rather, we expose the fieldwide norm that when an institution, nation, or subfield authors computer vision papers with downstream patents, the majority of these papers are used in surveillance patents. In total, we find the number of papers with downstream surveillance patents increased more than five-fold between the 1990s and the 2010s, with computer vision research now having been used in more than 11,000 surveillance patents. Finally, in addition to the high levels of surveillance we find documented in computer vision papers and patents, we unearth pervasive patterns of documents using language that obfuscates the extent of surveillance. Our analysis reveals the pipeline by which computer vision research has powered the ongoing expansion of surveillance.
研究の動機と目的
- コンピュータビジョン研究が自己申告的に人間に関するデータの抽出を可能にしているかを評価する。
- 論文と下流特許における人間データ抽出の発生率と型を定量化する。
- 機関、国、サブ分野、年次を横断して監視AIの起源を地図化し、分野全体の規範を明らかにする。
- CV研究と特許における監視の含意を曖昧化する言語的慣行を特定する。
提案手法
- 19,000件超のCV論文と23,000件超の特許にリンクする40,000件超のコンピュータビジョン論文と下流特許を収集・分析する。
- サブセット(100件の論文と100件の特許)に対して質的内容分析を実施し、人間データ抽出ターゲットを分類する。
- 全コーパス(論文と特許)における人間データ抽出の有病率に関する定量統計を算出する。
- 監視特許に用いられる下流特許を持つCV論文の比率の推移を分析する。
- テキスト中の監視の含意を隠す言語パターンと曖昧化言語を検証する。
実験結果
リサーチクエスチョン
- RQ1注釈付きのCV論文と下流特許のうち、人間に関するデータを抽出する割合はどの程度か。
- RQ2CV論文と特許における人間データ抽出の4つの対象は何か、そしてそれらはどの程度一般的か。
- RQ3下流特許を持つCV論文は、年代・機関・国・サブ分野を超えて監視特許へどの程度波及しているか。
- RQ4CV研究と特許の監視可能性を隠す曖昧化言語の証拠はあるか。
- RQ51990年代から2010年代にかけて、CV研究と監視特許の関係はどう変化したか。
主な発見
- 注釈付きCV論文と特許の90%は人間に関するデータを抽出できる。
- 68%の papers and patents explicitly extract data about human bodies and body parts.
- The share of CV papers with downstream patents used in surveillance patents rose from 50% in the 1990s to 79% in the 2010s.
- The number of CV papers with downstream patents increased more than five-fold from the 1990s to the 2010s.
- There is pervasive obfuscating language that treats humans as objects or obscures human-data extraction in figures and datasets.
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。