[论文解读] A continental-scale dataset of ground beetles with high-resolution images and validated morphological trait measurements
本论文提出一个多模态、符合 FAIR 原则的数据集,包含来自美洲大陆及夏威夷30个站点的超过13,200 只 NEON 地面甲虫样本,具高分辨率图像和 validated 数字测量的鞘翅长宽。数字性状提取经与人工测量对比验证,精度达到亚毫米级,可在大陆尺度上开展 AI 驱动的披甲甲虫形态与生态分析。
Despite the ecological significance of invertebrates, global trait databases remain heavily biased toward vertebrates and plants, limiting comprehensive ecological analyses of high-diversity groups like ground beetles. Ground beetles (Coleoptera: Carabidae) serve as critical bioindicators of ecosystem health, providing valuable insights into biodiversity shifts driven by environmental changes. While the National Ecological Observatory Network (NEON) maintains an extensive collection of carabid specimens from across the United States, these primarily exist as physical collections, restricting widespread research access and large-scale analysis. To address these gaps, we present a multimodal dataset digitizing over 13,200 NEON carabids from 30 sites spanning the continental US and Hawaii through high-resolution imaging, enabling broader access and computational analysis. The dataset includes digitally measured elytra length and width of each specimen, establishing a foundation for automated trait extraction using AI. Validated against manual measurements, our digital trait extraction achieves sub-millimeter precision, ensuring reliability for ecological and computational studies. By addressing invertebrate under-representation in trait databases, this work supports AI-driven tools for automated species identification and trait-based research, fostering advancements in biodiversity monitoring and conservation.
研究动机与目标
- 通过产生公开可获得的高分辨率图像与性状数据集,解决全球性状数据库中无脊椎动物的不足(以甲虫科为对象)。
- 通过提供 validated 的数字测量(鞘翅长度与宽度)及透明的误差度量,支持自动性状提取与 AI 驱动分析。
- 将形态数据与 NEON 环境数据集整合,研究大陆尺度上跨生态系统的性状-环境相互作用。
提出的方法
- 在 30 个 NEON 站点进行标准化的陷阱采集,覆盖 81 个 NEON 陆地站点与 20 个生态气候域。
- 使用站点特定协议对瓶装样本与针插样品进行高分辨率成像,确保一致性与元数据保留。
- 通过 TORAS 对针插样品进行形态性状测量(鞘翅长度、基底前胸宽度、最大鞘翅宽度)并进行刻度尺标定。
- Notes from Nature 工作流程用于测量瓶装样本的鞘翅长度与鞘翅宽度,基于组图像。
- 混合分割管线结合 Grounding DINO 进行初步边界框定位,CVAT 进行人工 refinement,以分离单个标本。
- 将像素测量的多边线长度转换为毫米,使用刻度尺;对标注者之间的一致性进行检验。

实验结果
研究问题
- RQ1大陆尺度的地面甲虫数据集,具有高分辨率图像和验证过的测量,能否支持 AI 驱动的性状提取与物种识别?
- RQ2数字化测量的形态性状(鞘翅长度与宽度)在精度与可靠性方面,与人工测量相比怎样?
- RQ3如何将与 NEON 环境协变量整合的形态数据用于跨分类群与性状-环境分析?
- RQ4大规模无脊椎动物图像数据集的自动分割与测量工作流程的可行性与可靠性如何?
主要发现
- 数据集中为超过 13,200 只 NEON 地面甲虫在 30 个站点提供了数字化测量的鞘翅长度与宽度。
- 数字化性状提取在与人工测量对比验证时达到亚毫米级精度。
- 针插样本使用标准化协议,通过 Canon EOS 7D 与微距镜头拍摄,记录了详细的成像参数。
- 瓶装样本通过 Notes from Nature 提供两项性状测量(鞘翅长度与宽度),对鞘翅长度的标注者之间一致性进行了评估,但鞘翅宽度的变异性导致最终分析中排除了瓶装鞘翅宽度的使用。
- 混合分割工作流(Grounding DINO + CVAT)实现了从复杂群体图像中可扩展地分离单个标本。
- 数据集遵循 FAIR 原则,并与 NEON 环境数据集整合以进行性状-环境分析。

更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。