QUICK REVIEW

[論文レビュー] Towards Safer Smart Contracts: A Sequence Learning Approach to Detecting Security Threats

Wesley Joon-Wie Tann, Xing Han|arXiv (Cornell University)|Nov 16, 2018

Advanced Malware Detection Techniques参考文献 46被引用数 74

ひとこと要約

この論文は、Ethereumのopcodeレベルでスマートコントラクトのセキュリティ脅威を検出するLSTMベースのアプローチを提示し、テスト精度ほぼ99%を達成し、620k個のコントラクトで象徴的ツール Maianを上回る。

ABSTRACT

Symbolic analysis of security exploits in smart contracts has demonstrated to be valuable for analyzing predefined vulnerability properties. While some symbolic tools perform complex analysis steps, they require a predetermined invocation depth to search vulnerable execution paths, and the search time increases with depth. The number of contracts on blockchains like Ethereum has increased 176 fold since December 2015. If these symbolic tools fail to analyze the increasingly large number of contracts in time, entire classes of exploits could cause irrevocable damage. In this paper, we aim to have safer smart contracts against emerging threats. We propose the approach of sequential learning of smart contract weaknesses using machine learning---long-short term memory (LSTM)---that allows us to be able to detect new attack trends relatively quickly, leading to safer smart contracts. Our experimental studies on 620,000 smart contracts prove that our model can easily scale to analyze a massive amount of contracts; that is, the LSTM maintains near constant analysis time as contracts increase in complexity. In addition, our approach achieves $99\%$ test accuracy and correctly analyzes contracts that were false positive (FP) errors made by a symbolic tool.

研究の動機と目的

展開済みコントラクトの増加とEthereum上の不可逆的な悪用が進む中、より安全なスマートコントラクトを動機づける。
迅速な脅威検出のための象徴分析に代わる機械学習を提案する。
大規模なEthereumコントラクトデータセットでのスケーラビリティと検出精度を評価する。
LSTMが脆弱性検出において既存の象徴分析ツールと同等かそれを上回ることを示す。

提案手法

Ethereumのopcodeシーケンス上でLSTMを用いて2クラスの脅威検出問題をモデル化する。
命令間の意味的関係を捉えるために、opcodeを埋め込みで表現する。
SMOTEとリサンプリングを用いてクラスをバランスさせた大規模データセット（620,000コントラクト）で訓練・評価する。
二値分類のためのバイナリ交差エントロピー損失と、opcodeシーケンスの埋め込みベースの入力表現を使用する。
Maian象徴分析ツールと性能を比較し、精度、F1、FPリカバリなどの指標を報告する。

実験結果

リサーチクエスチョン

RQ1LSTMモデルはopcodeシーケンスからEthereumスマートコントラクトのセキュリティ脅威を検出できるか？
RQ2精度とスケーラビリティの観点で、LSTMベースの手法はMaianのような象徴分析ツールとどう比較されるか？
RQ3象徴ツールで識別された偽陽性をモデルが回復できるか、時間とともに新しい脅威パターンを検出できるか？
RQ4データセットサイズが大きくなるにつれて、大量のコントラクトを分析する際のアプローチのスケーラビリティはどの程度か？
RQ5脆弱性に関連する意味的関係を捉える上で、opcode埋め込みはどんな役割を果たすか？

主な発見

LSTMモデルは評価セットで約99%のテスト精度を達成する。
脆弱性検出で約86%のF1スコアを達成する。
Maianが偽陽性とラベル付けした難易度の高いコントラクトの約92.86%を検出する。
コントラクトの複雑さが増しても解析時間はほぼ一定で、大規模なコントラクト集団の分析を実現する。
LSTMは、安全なスマートコントラクトのための象徴分析ツールに対する競争力のある代替手段となり得る。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。