QUICK REVIEW

[论文解读] Responses to Critiques on Machine Learning of Criminality Perceptions (Addendum of arXiv:1611.04135)

Xiaolin Wu, Xi Zhang|arXiv (Cornell University)|Nov 13, 2016

Crime Patterns and Interventions参考文献 33被引用 36

一句话总结

本文回应了针对作者先前关于使用深度学习从人脸图像预测犯罪性的研究的广泛批评。文中明确指出，研究目的仅为学术性质——测试机器学习是否能复现人类对人脸的社会感知，而非用于执法或推动优生学。尽管报告的准确率很高（真阳性率为89%），但贝叶斯分析显示，基于阳性预测的实际犯罪概率仅为4.39%，这是由于基础率过低所致，凸显了媒体在报道中忽视基础率谬误的危险性。

ABSTRACT

In November 2016 we submitted to arXiv our paper "Automated Inference on Criminality Using Face Images". It generated a great deal of discussions in the Internet and some media outlets. Our work is only intended for pure academic discussions; how it has become a media consumption is a total surprise to us. Although in agreement with our critics on the need and importance of policing AI research for the general good of the society, we are deeply baffled by the ways some of them mispresented our work, in particular the motive and objective of our research.

研究动机与目标

探究机器学习是否能够复现人类对人脸的社会感知，特别是推断诸如犯罪性等特质。
通过犯罪性这一高对比度案例，检验面部特征与社会行为相关性的假设。
明确指出该研究并非旨在实际部署，也非为了促进种族或社会偏见。
纠正媒体广泛传播的误解，即该工作是科学上的种族主义或监控工具。
强调在解释AI模型性能时，尤其是基础率问题，严谨的统计推理至关重要。

提出的方法

作者在包含2000张中国男性身份证照片的数据集上训练了卷积神经网络（CNN），依据法院判决结果将样本标记为罪犯或非罪犯。
通过仿射变换对齐面部关键点，对人脸图像进行预处理，以减少变异并提升模型泛化能力。
使用标准指标评估模型，包括真阳性率（89%）和假阳性率（7%）。
应用贝叶斯推断，利用公式计算给定阳性预测下犯罪性的后验概率：P(C|+) = [P(+|C)P(C)] / [P(+|C)P(C) + P(+|N)(1−P(C))]。
为检验过拟合，作者对数据集进行了随机重标记，发现无分类器能将随机标签分离得优于随机水平，表明模型具有鲁棒性。
作者控制了面部表情和图像伪影（如压缩噪声）等因素，以防止模型学习到表面模式。

实验结果

研究问题

RQ1机器学习模型能否检测到面部特征与社会感知（如犯罪性）之间的相关性？
RQ2深度学习模型在多大程度上能复现人类基于面部外观的第一印象？
RQ3在考虑人群中犯罪率较低的基础率时，此类模型的实际预测能力如何？
RQ4面部感知的文化差异如何影响模型输出的解读？
RQ5模型结果在多大程度上由数据偏差或过拟合驱动，而非真实相关性？

主要发现

该CNN分类器在识别中国男性罪犯的身份证照片时，真阳性率达到89%。
尽管真阳性率很高，但由于中国犯罪率基础率仅为0.36%，因此给定阳性预测的实际犯罪后验概率仅为4.39%。
随机标记实验表明，无分类器能将随机标记数据分离得优于随机水平，表明模型未对训练数据过拟合。
模型对图像层面的差异（如压缩和相机差异）具有鲁棒性，表明其学习的是面部结构模式，而非表面伪影。
观察到面部感知的文化差异：西方观察者在某些人脸聚类中感知到微笑，而中国观察者则未感知到，表明跨文化解读存在差异。
作者承认，社会经济地位线索（如白领衬衫）未被控制，这可能影响模型表现，并引发公平性和代表性方面的担忧。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。