Skip to main content
QUICK REVIEW

[논문 리뷰] A continental-scale dataset of ground beetles with high-resolution images and validated morphological trait measurements

S M Rayeed, Mridul Khurana|arXiv (Cornell University)|2026. 01. 14.
Environmental DNA in Biodiversity Studies인용 수 0
한 줄 요약

이 논문은 대륙 미국과 하와이에 걸친 30개 현장에서 13,200마리 넘는 NEON 지상 딱정벌레 표본의 멀티모달, FAIR 준수 데이터셋을 제시하며, 고해상도 이미지는 물론 elytra 길이 및 너비의 검증된 디지털 측정치를 제공합니다. 디지털 형질 추출은 수동 측정과 비교하여 소수점 이하 밀리미터 수준의 정밀도로 검증되며, 대륙 규모에서의 Carabid 형태학 및 생태학 분석을 AI 기반으로 가능하게 합니다.

ABSTRACT

Despite the ecological significance of invertebrates, global trait databases remain heavily biased toward vertebrates and plants, limiting comprehensive ecological analyses of high-diversity groups like ground beetles. Ground beetles (Coleoptera: Carabidae) serve as critical bioindicators of ecosystem health, providing valuable insights into biodiversity shifts driven by environmental changes. While the National Ecological Observatory Network (NEON) maintains an extensive collection of carabid specimens from across the United States, these primarily exist as physical collections, restricting widespread research access and large-scale analysis. To address these gaps, we present a multimodal dataset digitizing over 13,200 NEON carabids from 30 sites spanning the continental US and Hawaii through high-resolution imaging, enabling broader access and computational analysis. The dataset includes digitally measured elytra length and width of each specimen, establishing a foundation for automated trait extraction using AI. Validated against manual measurements, our digital trait extraction achieves sub-millimeter precision, ensuring reliability for ecological and computational studies. By addressing invertebrate under-representation in trait databases, this work supports AI-driven tools for automated species identification and trait-based research, fostering advancements in biodiversity monitoring and conservation.

연구 동기 및 목표

  • 동물 미생물의 전 세계 형질 데이터베이스에서의 과소 대표 문제를 해결하기 위해 지상 딱정벌레(carabids)의 고해상도 이미지 및 형질 데이터셈을 공개적으로 접근 가능하게 생산한다.
  • 자동 형질 추출과 AI 기반 분석을 가능하게 하기 위해 검증된 디지털 측정치(elytral 길이와 너비)와 투명한 오차 지표를 제공한다.
  • Morphological 데이터를 NEON 환경 데이터셋과 통합하여 대륙 규모의 다양한 생태계에서 형질-환경 상호작용을 연구한다.

제안 방법

  • 30개의 NEON 현장을 아우르는 81개의 NEON 육지 현장 및 20개의 생태기후 도메인에 걸친 표준화된 트랩 설치 sampling.
  • 현장별 프로토콜을 사용해 vial 및 고정 표본의 고해상도 이미징을 수행하고 메타데이터 보존을 보장한다.
  • TORAS를 이용한 핀 표본의 형태학적 형질 측정(elytral 길이, 기저 전복체(width), 최대 elytral 너비) 및 스케일 바 보정.
  • vial 표본에 대해 Notes from Nature 워크플로우를 활용해 그룹 이미지에서 elytral 길이와 너비를 측정한다.
  • 개별 표본 분리를 위해 Grounding DINO의 초기 바운딩 박스와 CVAT의 수동 정제를 결합한 하이브리드 분할 파이프라인을 사용한다.
  • 스케일 바를 이용해 픽셀 측정에서 밀리미터로의 다중선 길이 변환; vial 측정에 대한 해석자 간 신뢰도 검사를 수행한다.
Figure 1 : Map of NEON terrestrial sites across the United States of America. Each circle marks a NEON terrestrial site: black fill indicates sites where we imaged carabid samples. The inset shows the Bartlett Experimental Forest BART site in detail, illustrating NEON’s spatial sampling design acros
Figure 1 : Map of NEON terrestrial sites across the United States of America. Each circle marks a NEON terrestrial site: black fill indicates sites where we imaged carabid samples. The inset shows the Bartlett Experimental Forest BART site in detail, illustrating NEON’s spatial sampling design acros

실험 결과

연구 질문

  • RQ1높은 해상도 이미지와 검증된 측정치를 갖춘 대륙 규모의 지상 딱정벌레 데이터세트가 AI 기반 형질 추출 및 종 식별을 지원할 수 있는가?
  • RQ2디지털로 측정된 형태 형질(elytral 길이와 너비)이 수동 측정에 비해 정밀도와 신뢰성 측면에서 어떻게 비교되는가?
  • RQ3NEON의 환경 공변량과 통합된 형태 데이터가 Carabids에서의 교차 분류 및 형질-환경 분석을 어떻게 가능하게 하는가?
  • RQ4대규모 무척추동물 이미지 데이터셋을 위한 자동 분할 및 측정 워크플로의 실현 가능성과 신뢰성은 어떻게 되는가?

주요 결과

  • 데이터셋은 30개 현장에서 13,200마리 이상의 NEON Carabidae에 대해 디지털로 측정된 elytra 길이와 너비를 포함한다.
  • 수동 측정과 비교해 디지털 형질 추출이 소수점 이하 밀리미터 수준의 정밀도를 달성한다.
  • 고정 표본은 Canon EOS 7D 및 매크로 렌즈를 사용한 표준화된 프로토콜로 이미징되었으며 자세한 이미징 매개변수가 문서화되어 있다.
  • vial 표본은 Notes from Nature를 통해 두 형질을 측정했으며 elytral 길이에 대해서는 해석자 간 합의가 평가되었지만 너비의 변동성으로 인해 최종 분석에서 vial elytral width는 제외되었다.
  • 하이브리드 분할 워크플로우(Grounding DINO + CVAT)를 통해 복합 그룹 이미지에서 개별 표본의 확장 가능한 분리를 가능하게 한다.
  • 데이터셋은 FAIR 원칙을 준수하며 형질-환경 분석을 위해 NEON 환경 데이터와 통합된다.
Figure 2 : Workflow for standardized ground beetle collection and processing at NEON sites. The process begins with pitfall trap setup ( 69 ) and proceeds through the collection of captured organisms. Specimens are filtered to separate carabids from bycatch. If identified as a beetle, the specimen i
Figure 2 : Workflow for standardized ground beetle collection and processing at NEON sites. The process begins with pitfall trap setup ( 69 ) and proceeds through the collection of captured organisms. Specimens are filtered to separate carabids from bycatch. If identified as a beetle, the specimen i

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.