Skip to main content
QUICK REVIEW

[论文解读] It's not the voting that's democracy, it's the counting: Statistical detection of systematic election irregularities

Peter Klimek, Yuri Yegorov|arXiv (Cornell University)|Jan 15, 2012
Media Influence and Politics被引用 10
一句话总结

本文提出一种统计方法,通过分析选区范围内得票分布的尖峰度来检测系统性选举异常。利用数据坍缩和参数模型,该方法在俄罗斯选举中识别出选票造假行为,其尖峰度比公正选举高出100倍,提供了一种具有跨国有效性的选举诚信检验方法。

ABSTRACT

Democratic societies are built around the principle of free and fair elections, that each citizen's vote should count equal. National elections can be regarded as large-scale social experiments, where people are grouped into usually large numbers of electoral districts and vote according to their preferences. The large number of samples implies certain statistical consequences for the polling results which can be used to identify election irregularities. Using a suitable data collapse, we find that vote distributions of elections with alleged fraud show a kurtosis of hundred times more than normal elections on certain levels of data aggregation. As an example we show that reported irregularities in recent Russian elections are indeed well explained by systematic ballot stuffing and develop a parametric model quantifying to which extent fraudulent mechanisms are present. We show that if specific statistical properties are present in an election, the results do not represent the will of the people. We formulate a parametric test detecting these statistical properties in election results. Remarkably, this technique produces similar outcomes irrespective of the data resolution and thus allows for cross-country comparisons.

研究动机与目标

  • 开发一种统计方法,用于检测超越简单投票模式的系统性选举异常。
  • 识别选举结果因选票造假等欺诈机制而未能反映人民真实意愿的情况。
  • 创建一种在不同数据分辨率和聚合层级下均稳健的跨国有效检验方法。
  • 利用参数模型量化现实世界选举中欺诈机制的程度。

提出的方法

  • 对不同分辨率下的选区范围内的汇总得票分布应用数据坍缩。
  • 计算得票份额分布的尖峰度,以检测公正选举中预期统计行为的偏离。
  • 使用参数模型量化系统性欺诈(如选票造假)的存在及其程度。
  • 将观测到的尖峰度值与公正选举条件下的预期值进行比较,以识别异常。
  • 通过在多种聚合层级上进行测试,确保方法论的稳健性,从而支持跨国比较。
  • 以全国性选举的庞大样本量为基础,进行统计推断。

实验结果

研究问题

  • RQ1即使单个结果看似合理,投票分布的统计特性是否仍能揭示系统性选举舞弊?
  • RQ2与公正选举相比,选票造假在多大程度上扭曲了得票分布的尖峰度?
  • RQ3参数模型是否能可靠地量化报告选举结果中欺诈机制的水平?
  • RQ4该方法在不同数据分辨率和国家背景下是否仍具有效性和一致性?
  • RQ5真实选举中的观测尖峰度值与公正投票条件下理论预期值相比如何?

主要发现

  • 存在欺诈指控的选举在某些聚合层级下,其尖峰度值约为公正选举的100倍。
  • 该方法成功识别出近期俄罗斯选举中系统性选票造假是异常现象的根源。
  • 参数模型量化了欺诈机制的程度,提供了一种可测量的选举操纵指标。
  • 该统计检验在不同数据分辨率下保持一致,支持有效的跨国比较。
  • 公正选举中的得票分布符合预期的统计模式,而欺诈选举则显著偏离,尤其体现在尖峰度上。
  • 得票份额分布中出现高尖峰度表明,结果未能真实反映选民的意愿。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。