[논문 리뷰] A Survey on Patent Analysis: From NLP to Multimodal AI
AI 기반 특허 분석 방법의 포괄적 조사(2017–2023), 분류, 검색, 품질 분석 및 생성에 걸친 텍스트 및 이미지 데이터를 다루고, 새로운 다중모달 분류체계와 향후 방향을 제시.
Recent advances in Pretrained Language Models (PLMs) and Large Language Models (LLMs) have demonstrated transformative capabilities across diverse domains. The field of patent analysis and innovation is not an exception, where natural language processing (NLP) techniques presents opportunities to streamline and enhance important tasks -- such as patent classification and patent retrieval -- in the patent cycle. This not only accelerates the efficiency of patent researchers and applicants, but also opens new avenues for technological innovation and discovery. Our survey provides a comprehensive summary of recent NLP-based methods -- including multimodal ones -- in patent analysis. We also introduce a novel taxonomy for categorization based on tasks in the patent life cycle, as well as the specifics of the methods. This interdisciplinary survey aims to serve as a comprehensive resource for researchers and practitioners who work at the intersection of NLP, Multimodal AI, and patent analysis, as well as patent offices to build efficient patent systems.
연구 동기 및 목표
- 특허 분석을 위한 AI 도구의 네 가지 주요 작업(분류, 검색, 품질 분석, 생성)에 걸친 통합 개요를 제공한다.
- 특허 생애주기 작업과 AI 모달리티에 따라 방법을 분류하는 새로운 분류체계를 도입한다.
- 2017–2023년의 특허 AI 연구에서 사용된 주요 데이터셋, 모델, 평가 지표를 요약한다.
- 다중모달 학습과 특허를 위한 생성형 AI를 포함한 도전과제, 격차 및 향후 방향을 강조한다.
제안 방법
- 2017–2023년 기간 동안 26개 학술지/회의에서 발표된 40편이 넘는 논문에 대한 조사와 종합.
- 작업(분류, 검색, 품질 분석, 생성)을 인공지능 방법(전통적 ML, 신경망, LLMs, 다중모달)과 연결하는 분류체계 개발.
- 특허 생애주기 작업별로 구성하며 데이터셋, 방법, 평가 지표에 대한 섹션으로 구성.
- 특허를 위한 다중모달 및 생성형 AI 트렌드에 대한 논의.
- 향후 연구 방향 및 잠재적 데이터세트에 대한 제안을 포함.
실험 결과
연구 질문
- RQ12017년부터 2023년까지 특허 분석 작업(분류, 검색, 품질 분석, 생성)에 어떤 AI 방법이 적용되었는가?
- RQ2텍스트 전용과 다중모달(텍스트+이미지) 접근 방식은 특허 분석 작업에서 어떻게 비교되는가?
- RQ3AI 기반 특허 분석 연구에서 사용되는 데이터셋, 평가 지표, 그리고 경향은 무엇인가?
- RQ4향후 방향성으로 다중모달 학습, 생성형 AI, 지식 그래프 등이 특허 분석에 어떤 가능성을 보이는가?
주요 결과
- AI 도구는 특허 분류, 검색, 품질 분석, 생성에 점점 더 많이 사용되고 있다.
- 전통 ML에서 딥러닝 및 대형 언어 모델로의 전환이 있으며, SciBERT 같은 도메인 특화 변형도 있다.
- 텍스트, 이미지 및 메타데이터를 통합하는 다중모달 접근법이 연구 방향으로 부상하고 있다.
- 새로운 분류체계가 특허 생애주기 작업을 AI 방법과 데이터 모달리티와 연결한다.
- 향후 방향에는 다중모달 데이터셋, 특허를 위한 생성형 AI, 지식 그래프, 생성된 콘텐츠에 대한 도메인 특화 평가가 포함된다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.