[論文レビュー] MLRM: A Multiple Linear Regression based Model for Average Temperature\n Prediction of A Day
本論文は、前日の3日間から日別平均気温を予測する特徴選択付きの重回帰モデルを提案し、テストセットで約2.8°Cの誤差を達成している。
Weather is a phenomenon that affects everything and everyone around us on a\ndaily basis. Weather prediction has been an important point of study for\ndecades as researchers have tried to predict the weather and climatic changes\nusing traditional meteorological techniques. With the advent of modern\ntechnologies and computing power, we can do so with the help of machine\nlearning techniques. We aim to predict the weather of an area using past\nmeteorological data and features using the Multiple Linear Regression Model.\nThe performance of the model is evaluated and a conclusion is drawn. The model\nis successfully able to predict the average temperature of a day with an error\nof 2.8 degrees Celsius.\n
研究の動機と目的
- prior three days の天気データを用いて日付の平均気温を予測する。
- 回帰前に非線形および有意でない特徴を除去するための特徴選択を適用する。
- 訓練/テスト分割でモデル性能を評価し、予測温度と実測温度を可視化する。
- Weather Undergroundデータで実現可能性を示し、予測精度を評価する。
提案手法
- 線形関係を評価するためのピアソン相関を計算し、|r| > 0.6 の特徴を選択する。
- 0.05の有意水準でp値を用いた後退除去を適用し、有意でない特徴を除く。
- MLRモデルのためにデータを80%の訓練と20%のテストに分割する。
- 実測値と予測温度の平方和誤差を最小化するようにMLRモデルを訓練する。
- 特徴選択、モデル訓練、評価、および可視化のためにPythonライブラリ(Pandas, StatsModels, scikit-learn, matplotlib)を使用する。
実験結果
リサーチクエスチョン
- RQ1提案されたMLRアプローチを用いて日次平均気温を予測する際の達成可能な平均絶対誤差/平均二乗誤差はどれくらいか。
- RQ2相関ベースのスクリーニングと後退除去の後に初期セットのうちどの特徴が有意であり続けるか。
- RQ3過去3日間から日次平均気温を予測した場合、未知データに対してMLRモデルはどの程度の性能を示すか。
- RQ4この天気予測タスクにおける線形回帰モデルの改善における特徴選択の役割は何か。
主な発見
- 本研究は997件のWeather Undergroundデータセットを使用した。
- 特徴選択後、MLRモデルには7つの特徴が残った。
- モデルはテストセットで絶対平均誤差2.8度を達成した。
- ピアソン相関フィルタリングにより、後退除去前にすべての残りの特徴の|r| > 0.6が保証された。
- 最終モデルの予測をプロットすると、y = x線に密接に一致し、高い精度を示している。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。