Skip to main content
QUICK REVIEW

[논문 리뷰] What do online listings tell us about the housing market?

Michele Loberto, Andrea Luciani|arXiv (Cornell University)|2020. 04. 06.
Housing Market and Economics참고 문헌 27인용 수 74
한 줄 요약

이 논문은 이탈리아의 온라인 임대 광고를 분석하여 중복 ads 를 정량화하고, 이를 기계 학습으로 정제하며, 매물이 수요, 공급, 유동성 및 가격 역학을 어떻게 알려주는지 시연합니다.

ABSTRACT

Traditional data sources for the analysis of housing markets show several limitations, that recently started to be overcome using data coming from housing sales advertisements (ads) websites. In this paper, using a large dataset of ads in Italy, we provide the first comprehensive analysis of the problems and potential of these data. The main problem is that multiple ads ("duplicates") can correspond to the same housing unit. We show that this issue is mainly caused by sellers' attempt to increase visibility of their listings. Duplicates lead to misrepresentation of the volume and composition of housing supply, but this bias can be corrected by identifying duplicates with machine learning tools. We then focus on the potential of these data. We show that the timeliness, granularity, and online nature of these data allow monitoring of housing demand, supply and liquidity, and that the (asking) prices posted on the website can be more informative than transaction prices.

연구 동기 및 목표

  • 온라인 주택 목록이 주택 시장 데이터 소스로서 가지는 한계 평가.
  • 중복 광고가 공급, 수요 및 가격 측정에 미치는 영향을 정량화.
  • 중복 광고를 식별하고 실제 매물로 병합하는 머신 러닝 파이프라인 개발.
  • 중복 제거된 데이터 세트를 공식 통계 및 지역 가격 측정치와 대조해 검증.
  • 목록 데이터가 수요, 공급, 유동성 및 가격 역학을 모니터링하는 데 어떻게 활용될 수 있는지 보여줌.

제안 방법

  • Immobiliare.it 주간 광고 스냅샷(2016-2018)을 사용해 약 140만 개의 광고와 약 95만 개의 주택 유닛 데이터셋 구축
  • 광고 간 유사성 평가를 위한 텍스트 분석(doc2vec) 및 구조화된 특징 거리 측정 사용
  • 두 광고가 같은 주거지인지 판단하기 위해 C5.0 의사결정 트리 구현(같은 사용자 vs 다른 사용자 모델 분리)
  • 중복을 단일 목록으로 모으는 광고 클러스터를 구성하고 중복 제거 최종 데이터세트 생성
  • 제거된 목록, 매매 및 가격 측정을 공식 소스(OMI, Italian Housing Market Survey)와 비교해 데이터 제거를 검증
  • 중복의 결정 요인과 역학을 분석하고 측정 오류 및 정책 유용성에 대한 시사점을 평가

실험 결과

연구 질문

  • RQ1온라인 주택 목록에서 중복 광고로 인해 측정 오차가 얼마나 큰가?
  • RQ2머신 러닝 기반 중복 제거가 광고 수준의 데이터에서 실제 주거 유닛을 신뢰성 있게 회복할 수 있는가?
  • RQ3온라인 목록이 전통적 소스와 비교했을 때 주택 수요, 공급, 유동성 및 가격 역학에 대해 무엇을 말해 주는가?

주요 결과

  • 중복으로 인해 상당하지만 불균등한 측정 오차가 발생하며, 집계가 높을수록 영향은 작아지고 지역 시장에서는 더 큰 편차를 보인다.
  • 약 77%의 주택에 단일 광고가 연관되고, 13%는 두 개의 중복 광고, 10%는 두 개를 초과하는 광고를 가지며, 일부 매물의 광고 중 중복의 비중이 상당하다.
  • 새로운 중복 제거된 매물은 공식 통계의 상실 광고(delistings), 매매 및 가격 수준과 일치하며, 중복 제거가 특히 지역 수준에서 편향을 감소시킨다.
  • 판매자/중개인은 매도가가 높거나 수요가 약할 때 여러 광고를 게시하는 경향이 있어, 조건 및 인센티브와 연관된 비무작위 중복임을 시사한다.
  • 온라인 목록 데이터는 웹페이지 방문을 통해 수요를 추정하고, 시장 체결 시간 및 가격 수정 예측에 활용되며, 중복 제거가 제대로 이루어지면 가격 동향과 시장 긴축에 신속한 신호를 제공한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.