Skip to main content
QUICK REVIEW

[논문 리뷰] An Open-Source Robotics Research Platform for Autonomous Laparoscopic Surgery

Ariel Rodriguez, Lorenzo Mazza|arXiv (Cornell University)|2026. 03. 09.
Surgical Simulation and Training인용 수 0
한 줄 요약

본 논문은 오픈 소스, 로봇-독립적인 RCM 컨트롤러와 closed-form 분석적 속도 해를 갖춘 ROS 기반 플랫폼을 제시하며 UR5e 및 Panda 팔을 사용해 원격 조작, 데이터 수집, 자율 정책 배치를 통해 복강경 작업을 가능하게 하고, 파편성, 체외, 생체 내 돼지 시술에서 검증되었다.

ABSTRACT

Autonomous robot-assisted surgery demands reliable, high-precision platforms that strictly adhere to the safety and kinematic constraints of minimally invasive procedures. Existing research platforms, primarily based on the da Vinci Research Kit, suffer from cable-driven mechanical limitations that degrade state-space consistency and hinder the downstream training of reliable autonomous policies. We present an open-source, robot-agnostic Remote Center of Motion (RCM) controller based on a closed-form analytical velocity solver that enforces the trocar constraint deterministically without iterative optimization. The controller operates in Cartesian space, enabling any industrial manipulator to function as a surgical robot. We provide implementations for the UR5e and Franka Emika Panda manipulators, and integrate stereoscopic 3D perception. We integrate the robot control into a full-stack ROS-based surgical robotics platform supporting teleoperation, demonstration recording, and deployment of learned policies via a decoupled server-client architecture. We validate the system on a bowel grasping and retraction task across phantom, ex vivo, and in vivo porcine laparoscopic procedures. RCM deviations remain sub-millimeter across all conditions, and trajectory smoothness metrics (SPARC, LDLJ) are comparable to expert demonstrations from the JIGSAWS benchmark recorded on the da Vinci system. These results demonstrate that the platform provides the precision and robustness required for teleoperation, data collection and autonomous policy deployment in realistic surgical scenarios.

연구 동기 및 목표

  • 복강경 로봇공학을 위한 trocar RCM 제약을 적용하는 오픈 소스, 로봇-독립 플랫폼을 제공한다.
  • 텔레오퍼레이션, 데이터 수집 및 자율 정책 배포를 가능하게 하는 전체 스택 ROS 기반 시스템을 제공한다.
  • 파편성, 체외 및 생체 내 돼지 시술에서 RCM 정확도와轨迹 매끄러움을 검증한다.
  • 수집된 데이터 세트에서 모방 학습을 통해 데이터 수집 및 정책 학습 준비성을 입증한다.

제안 방법

  • 적합한 매니퓰레이터에 대해 Cartesian 공간에서 RCM을 결정론적으로 강제하는 closed-form 분석 속도 컨트롤러를 개발한다.
  • ROS 기반 소프트웨어 스택 내에서 UR5e와 Franka Panda의 두 가지 하드웨어 구성을 텔레오퍼레이션 및 정책 배포에 통합한다.
  • 정책 추론을 ROS와 분리하기 위해 ZMQ 기반의 서버–클라이언트 아키텍처를 구현하고 동작 검증용 안전 컨트롤러를 포함한다.
  • 텔레오퍼레이션 중 원시 센서 데이터 및 내시경 비디오를 기록하여 학습용 구조화된 데이터 세트를 만든다.
  • 5차 다항식 속도 프로파일러를 적용하여 처짐/가속 한계 내에서 목표를 향한 매끄러운 운동을 생성한다.
Figure 2: The platform is built with modularity and scalability at its core, with inter-component communication abstracted through ROS topics to remain hardware-agnostic. This architecture allows input devices and robot actuators to be readily exchanged, and new modalities can be incorporated by sim
Figure 2: The platform is built with modularity and scalability at its core, with inter-component communication abstracted through ROS topics to remain hardware-agnostic. This architecture allows input devices and robot actuators to be readily exchanged, and new modalities can be incorporated by sim

실험 결과

연구 질문

  • RQ1오픈 소스, 로봇-독립적인 RCM 컨트롤러가 파편성, 체외 및 생체 내 설정에서 서브 밀리미터 단위의 RCM 편차를 달성할 수 있는가?
  • RQ2플랫폼이 독립 표준 벤치마크와 비교해 전문 수준의 궤적 매끄러움을 제공하면서 자율 정책 배치를 가능하게 하는가?
  • RQ3ROS 기반 전체 스택 아키텍처가 하드웨어와 환경 전반에서 강인한 텔레오퍼레이션, 데이터 수집 및 정책 롤아웃을 지원하는가?
  • RQ4수집된 데이터로 학습된 모방 학습 정책이 장(腸) 매 grasping 및 재세정과 같은 복강경 작업에서 높은 성공률을 달성하는가?

주요 결과

  • RCM 편차는 파편성, 체외 및 생체 내 시험에서 서브 밀리미터 이하를 유지한다.
  • 궤적 매끄러움 지표(SPARC, LDLJ)는 다 빈시스템의 JIGSAWS 벤치마크에서 전문가 시연과 비교 가능하다.
  • 플랫폼의 데이터 세트로 학습된 모방 학습 정책은 85%의 성공률(17/20 롤아웃)을 달성했다.
  • 원격 조작, 시연 기록 및 자율 정책 배포가 현실적 수술 상황에서 견고한 성능을 유지한다.
  • 시스템은 모듈식이고 하드웨어에 구애받지 않으며 UR5e 및 Panda 팔과 입체 내시경, 몰입형 시각화를 지원한다.
  • RCM 컨트롤러는 반복 최적화를 거치지 않고 닫힌 형식의 해석적 속도 해를 사용해 결정론적인 제약 강제를 수행한다.
Figure 4: Immersive stereoscopic visualization through the Meta Quest headset running Endomersion [ 11 ] showing the surgical workspace captured by the endoscope. Only the left eye view is shown; the right eye receives the corresponding stereo pair to enable depth perception.
Figure 4: Immersive stereoscopic visualization through the Meta Quest headset running Endomersion [ 11 ] showing the surgical workspace captured by the endoscope. Only the left eye view is shown; the right eye receives the corresponding stereo pair to enable depth perception.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.