QUICK REVIEW

[논문 리뷰] Towards Safer Smart Contracts: A Sequence Learning Approach to Detecting Security Threats

Wesley Joon-Wie Tann, Xing Han|arXiv (Cornell University)|2018. 11. 16.

Advanced Malware Detection Techniques참고 문헌 46인용 수 74

한 줄 요약

논문은 이더리움 바이트코드 수준에서 스마트 계약의 보안 위협을 탐지하는 LSTM 기반 접근법을 제시하며, 테스트 정확도 약 99%에 근접하고 620k 계약에서 Maian 같은 상징적 도구를 능가한다.

ABSTRACT

Symbolic analysis of security exploits in smart contracts has demonstrated to be valuable for analyzing predefined vulnerability properties. While some symbolic tools perform complex analysis steps, they require a predetermined invocation depth to search vulnerable execution paths, and the search time increases with depth. The number of contracts on blockchains like Ethereum has increased 176 fold since December 2015. If these symbolic tools fail to analyze the increasingly large number of contracts in time, entire classes of exploits could cause irrevocable damage. In this paper, we aim to have safer smart contracts against emerging threats. We propose the approach of sequential learning of smart contract weaknesses using machine learning---long-short term memory (LSTM)---that allows us to be able to detect new attack trends relatively quickly, leading to safer smart contracts. Our experimental studies on 620,000 smart contracts prove that our model can easily scale to analyze a massive amount of contracts; that is, the LSTM maintains near constant analysis time as contracts increase in complexity. In addition, our approach achieves $99\%$ test accuracy and correctly analyzes contracts that were false positive (FP) errors made by a symbolic tool.

연구 동기 및 목표

배포된 계약이 증가하고 이더리움에서 되돌릴 수 없는 익스플로잇이 발생하는 가운데 더 안전한 스마트 계약을 촉진한다.
상징적 분석에 대한 기계 학습 대안을 제시하여 빠른 위협 탐지를 도모한다.
대규모 이더리움 계약 데이터셋에서 확장성 및 탐지 정확도를 평가한다.
LSTM이 취약점 탐지에서 기존의 상징적 도구를 일치시키거나 능가할 수 있음을 보인다.

제안 방법

이더리움 opcodes 시퀀스에 대해 LSTM을 사용한 이진 위협 탐지 문제를 모델링한다.
명령 간 시맨틱 관계를 포착하기 위해 opcodes를 임베딩으로 표현한다.
SMOTE와 재샘플링으로 균형 클래스를 갖춘 대규모 데이터셋(620,000 계약)에서 학습 및 평가한다.
이진 분류를 위한 이진 크로스 엔트로피 손실과 opcode 시퀀스의 임베딩 기반 입력 표현을 사용한다.
Maian 상징적 분석 도구와의 성능을 비교하고 정확도, F1, FP-recovery 등의 지표를 보고한다.

실험 결과

연구 질문

RQ1LSTM 모델이 opcode 시퀀스로 이더리움 스마트 계약의 보안 위협을 탐지할 수 있는가?
RQ2정확도와 확장성 측면에서 LSTM 기반 방법은 Maian 같은 상징적 분석 도구와 어떻게 비교되는가?
RQ3모델이 상징적 도구가 식별한 거짓 양성을 회복하고 시간이 지남에 따라 새로운 위협 패턴을 탐지할 수 있는가?
RQ4데이터 세트가 커질 때 대량의 계약을 분석하는 데 이 방법의 확장성은 어느 정도인가?
RQ5opcode 임베딩이 취약점과 관련된 시맨틱 관계를 포착하는 데 어떤 역할을 하는가?

주요 결과

LSTM 모델은 평가 세트에서 약 99%의 테스트 정확도를 달성한다.
취약점 탐지에서 F1 점수 약 86%를 달성한다.
Maian이 거짓 양성으로 분류한 어려운 계약 중 약 92.86%까지 탐지한다.
계약 복잡도가 증가해도 LSTM은 거의 일정한 분석 시간으로 대규모 계약 집단의 확장을 가능하게 한다.
LSTM은 더 안전한 스마트 계약을 위한 상징적 분석 도구에 대한 경쟁력 있는 대안이 될 수 있다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.