QUICK REVIEW

[논문 리뷰] Pavement Missing Condition Data Imputation through Collective Learning-Based Graph Neural Networks

Ke Yu, Lu Gao|arXiv (Cornell University)|2026. 02. 22.

Infrastructure Maintenance and Monitoring인용 수 0

한 줄 요약

집합 학습 기반 그래프 신경망(CL GNN)을 도입하여 과거 데이터와 인접한 포장 구간 간의 공간적 의존성을 활용해 포장 상태 데이터의 누락값을 보정하고, 표준 모델에 비해 보정 정확도가 향상됨.

ABSTRACT

Pavement condition data is important in providing information regarding the current state of the road network and in determining the needs of maintenance and rehabilitation treatments. However, the condition data is often incomplete due to various reasons such as sensor errors and non-periodic inspection schedules. Missing data, especially data missing systematically, presents loss of information, reduces statistical power, and introduces biased assessment. Existing methods in dealing with missing data usually discard entire data points with missing values or impute through data correlation. In this paper, we used a collective learning-based Graph Convolutional Networks, which integrates both features of adjacent sections and dependencies between observed section conditions to learn missing condition values. Unlike other variants of graph neural networks, the proposed approach is able to capture dependent relationship between the conditions of adjacent pavement sections. In the case study, pavement condition data collected from Texas Department of Transportation Austin District were used. Experiments show that the proposed model was able to produce promising results in imputing the missing data.

연구 동기 및 목표

도로 네트워크의 포장 상태 데이터 누락 문제를 동기 부여하고 해결한다.
이웃한 포장 구간 간의 의존성을 캡처하는 CLGNN 프레임워크를 제안하여 보정에 활용한다.
역사적 상태 데이터와 공간 연결 정보를 모두 통합하여 누락 값 추정을 개선한다.
TxDOT Austin District 데이터에서 방법을 평가하고 기준 모델과 비교한다.

제안 방법

노드를 포장 구간으로, 간선을 공간적 연결로 삼아 그래프 기반 데이터 누락 보정 문제로 모델링한다.
무작위 마스킹, GCN 기반 레이블 예측, 예측 레이블과 관찰된 레이블의 통합, 반복 최적화의 4단계 집합 학습 프레임워크를 사용한다.
이웃 노드 간 정보를 전파하기 위해 GCN 계층을 적용하고 노드 차수에 의한 정규화를 수행한다.
손실 함수를 최소화하면서 라벨이 있는 데이터와 없는 데이터를 모두 사용하여 반복적으로 예측을 업데이트하며 학습한다.
CLGNN을 CART, NN, RF, GCN, GraphSAGE를 포함한 기준 모델과 비교한다.

Figure 1: Collective Learning-based GNN framework

실험 결과

연구 질문

RQ1현재 상태 점수의 이웃 포장 구간이 과거 데이터만으로는 충분하지 않은 누락 데이터 보정에 도움을 주는가?
RQ2집합 학습이 GNN 프레임워크에서 누락된 포장 상태 데이터 보정에 전통적 모델과 비교해 어떻게 수행되는가?
RQ3역사적 정보와 공간 정보를 모두 포함하는 것이 보정 정확도에 어떤 영향을 미치는가?
RQ4제안된 CLGNN이 TxDOT 포장 네트워크에 대해 확장 가능하고 실용적인가?

주요 결과

모델	정확도
CLGNN	0.773
GCN	0.725
GraphSAGE	0.721
RF	0.712
CART	0.654
NN	0.556

CLGNN은 기준 모델에 비해 보정 정확도에서 더 높은 성능(0.773)을 달성한다.
GCN(0.725) 및 GraphSAGE(0.721)가 CLGNN보다 낮으며 RF(0.712), CART(0.654), NN(0.556)보다 우수하다.
역사적 상태 점수와 이웃 구간의 현재 점수를 모두 포함하면 경쟁 모델 대비 약 5% 향상이 있다.
프레임워크는 TxDOT 오스틴 지구 데이터(2014-2018)에서 검증되었으며 누락 데이터 보정에 대해 유망한 결과를 보인다.

Figure 2: Condition Score Map in the Case Study Database

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.