Skip to main content
QUICK REVIEW

[논문 리뷰] Real-Time Prediction of BITCOIN Price using Machine Learning Techniques and Public Sentiment Analysis

Raju Sinha, Ali Mohammad Tarif|arXiv (Cornell University)|2020. 06. 18.
Blockchain Technology Applications and Security인용 수 36
한 줄 요약

이 논문은 Twitter와 Reddit의 감정 분석을 감독 학습 및 LSTM 시계열 모델과 결합하여 USD로의 비트코인 가격을 예측하고, ARIMA와 비교합니다. 다중 특징 입력을 갖춘 LSTM이 테스트된 모델들 중 가장 낮은 RMSE를 낳는다고 보고합니다.

ABSTRACT

Bitcoin is the first digital decentralized cryptocurrency that has shown a significant increase in market capitalization in recent years. The objective of this paper is to determine the predictable price direction of Bitcoin in USD by machine learning techniques and sentiment analysis. Twitter and Reddit have attracted a great deal of attention from researchers to study public sentiment. We have applied sentiment analysis and supervised machine learning principles to the extracted tweets from Twitter and Reddit posts, and we analyze the correlation between bitcoin price movements and sentiments in tweets. We explored several algorithms of machine learning using supervised learning to develop a prediction model and provide informative analysis of future market prices. Due to the difficulty of evaluating the exact nature of a Time Series(ARIMA) model, it is often very difficult to produce appropriate forecasts. Then we continue to implement Recurrent Neural Networks (RNN) with long short-term memory cells (LSTM). Thus, we analyzed the time series model prediction of bitcoin prices with greater efficiency using long short-term memory (LSTM) techniques and compared the predictability of bitcoin price and sentiment analysis of bitcoin tweets to the standard method (ARIMA). The RMSE (Root-mean-square error) of LSTM are 198.448 (single feature) and 197.515 (multi-feature) whereas the ARIMA model RMSE is 209.263 which shows that LSTM with multi feature shows the more accurate result.

연구 동기 및 목표

  • 기계 학습 및 공개 감정을 사용한 비트코인 가격 방향 예측 연구의 동기를 제시합니다.
  • Twitter와 Reddit에서 얻은 감정 신호를 USD 단위의 비트코인 가격 예측 모델에 통합합니다.
  • 실시간 가격 예측을 위해 전통적인 시계열 모델과 현대적인 신경망을 비교합니다.

제안 방법

  • 비트코인 관련 Twitter 및 Reddit 게시물에 대해 감정 분석을 적용하여 특징(feature)을 추출합니다.
  • 감독 학습 및 LSTM 네트워크를 포함한 시계열 모델을 사용하여 가격 예측을 수행합니다.
  • RMSE를 지표로 하여 ARIMA 기법을 기반으로 한 벤치마크 모델과의 비교 평가를 수행합니다.
  • 성능 향상 여부를 평가하기 위해 단일 특징 및 다중 특징 LSTM 구성의 비교를 수행합니다.

실험 결과

연구 질문

  • RQ1Twitter와 Reddit의 공개 감정이 USD 단위의 비트코인 가격 변동과 상관관계가 있습니까?
  • RQ2감정 특성을 포함할 때 LSTM 모델이 실시간 비트코인 가격 예측에서 ARIMA를 능가합니까?
  • RQ3다중 특징 입력이 비트코인 가격 예측 정확도에 미치는 영향은 무엇입니까?

주요 결과

  • 다중 특징 입력을 가진 LSTM은 최적의 RMSE 197.515를 달성하여 209.263의 ARIMA를 능가합니다.
  • 단일 특징을 가진 LSTM은 RMSE가 198.448로, 다중 특징 구성보다 약간 더 나쁩니다.
  • ARIMA baseline RMSE는 209.263으로, 이 설정에서 LSTM 기반 접근 방식의 이점을 보여줍니다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.