Skip to main content
QUICK REVIEW

[论文解读] From Innovations to Prospects: What Is Hidden Behind Cryptocurrencies?

Ang Jia, Ming Fan|arXiv (Cornell University)|Mar 16, 2021
Advanced Data Storage Technologies参考文献 58被引用 6
一句话总结

本文通过分析GitHub仓库和市场数据,实证研究了加密货币代币(altcoins)中的代码创新。研究发现超过85%的代币表现出高度的代码相似性,通过时间聚类构建了类生物谱系,尽管仅凭代码难以准确预测价格,但更高的创新水平与更好的市场前景相关。

ABSTRACT

The great influence of Bitcoin has promoted the rapid development of blockchain-based digital currencies, especially the altcoins, since 2013. However, most altcoins share similar source codes, resulting in concerns about code innovations. In this paper, an empirical study on existing altcoins is carried out to offer a thorough understanding of various aspects associated with altcoin innovations. Firstly, we construct the dataset of altcoins, including source code repositories, GitHub fork relations, and market capitalizations (cap). Then, we analyze the altcoin innovations from the perspective of source code similarities. The results demonstrate that more than 85% of altcoin repositories present high code similarities. Next, a temporal clustering algorithm is proposed to mine the inheritance relationship among various altcoins. The family pedigrees of altcoin are constructed, in which the altcoin presents similar evolution features as biology, such as power-law in family size, variety in family evolution, etc. Finally, we investigate the correlation between code innovations and market capitalization. Although we fail to predict the price of altcoins based on their code similarities, the results show that altcoins with higher innovations reflect better market prospects.

研究动机与目标

  • 理解代币中代码重用与创新的程度,回应加密货币领域技术原创性的担忧。
  • 利用源代码相似性和分叉关系,建模代币之间的演化关系,类比于生物谱系树。
  • 检验代码创新是否影响市场表现,特别是总市值和价格走势。
  • 为技术革新在决定代币长期市场前景中的作用提供实证证据。

提出的方法

  • 构建了一个数据集,整合了2018年活跃代币的GitHub仓库、分叉关系以及CoinMarketCap的总市值数据。
  • 应用RKR-GST算法计算代币仓库之间的基于文本的代码相似性,将源代码视为纯文本处理。
  • 提出一种时间聚类算法,通过代码相似性阈值(θs = 70%)和时间窗口(θt = 3个月)识别代币之间的继承关系。
  • 构建代币的家族谱系,以生物学类比建模其演化过程,包括家族规模的幂律分布和多样的演化路径。
  • 使用机器学习模型(决策树、朴素贝叶斯、多层神经网络)基于代码相似性特征预测新代币的相对价格变动。
  • 对代码创新指标与总市值之间的相关性进行分析,评估技术革新对市场表现的影响。

实验结果

研究问题

  • RQ1代币源代码在多大程度上被共享?整个生态系统中的代码相似性有多高?
  • RQ2如何建模代币之间的演化关系?其继承与开发过程中呈现出哪些模式?
  • RQ3代码创新与总市值或价格表现之间存在何种相关性?
  • RQ4能否基于新代币与现有代币的代码相似性,预测其市场前景?

主要发现

  • 超过85%的代币仓库表现出高度的代码相似性,其中超过90%的项目在源代码上至少有80%的相似度。
  • 代币的家族谱系遵循类生物演化模式,包括家族规模的幂律分布和多样的演化轨迹。
  • 尽管代码相似性很高,但仅基于代码特征预测价格变动的准确性随时间下降,2018年发布的代币准确率降至33%。
  • 尽管代码相似性本身无法可靠预测市场表现,但创新水平更高的代币始终展现出更好的市场前景。
  • 代码创新与总市值之间的相关性虽弱但为正,表明创新仍是长期成功的重要因素。
  • 研究发现,技术实现对价格趋势的影响随时间减弱,表明在后期阶段,市场情绪可能主导于技术优势。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。