Skip to main content
QUICK REVIEW

[论文解读] A Survey on Patent Analysis: From NLP to Multimodal AI

Homaira Huda Shomee, Zhu Wang|arXiv (Cornell University)|Apr 2, 2024
Intellectual Property and Patents被引用 6
一句话总结

对基于AI的专利分析方法的综合综述(2017–2023),涵盖文本和图像数据在分类、检索、质量分析和生成方面,并提出一种新的多模态分类法及未来方向。

ABSTRACT

Recent advances in Pretrained Language Models (PLMs) and Large Language Models (LLMs) have demonstrated transformative capabilities across diverse domains. The field of patent analysis and innovation is not an exception, where natural language processing (NLP) techniques presents opportunities to streamline and enhance important tasks -- such as patent classification and patent retrieval -- in the patent cycle. This not only accelerates the efficiency of patent researchers and applicants, but also opens new avenues for technological innovation and discovery. Our survey provides a comprehensive summary of recent NLP-based methods -- including multimodal ones -- in patent analysis. We also introduce a novel taxonomy for categorization based on tasks in the patent life cycle, as well as the specifics of the methods. This interdisciplinary survey aims to serve as a comprehensive resource for researchers and practitioners who work at the intersection of NLP, Multimodal AI, and patent analysis, as well as patent offices to build efficient patent systems.

研究动机与目标

  • 提供对专利分析中AI工具在四个主要任务(分类、检索、质量分析、生成)上的综合概览。
  • 引入一种新颖的分类法,将方法按专利生命周期任务和AI模态进行分类。
  • 总结2017–2023年在专利AI研究中使用的关键数据集、模型和评估指标。
  • 突出挑战、空白与未来方向,包括专利领域的多模态学习和生成式AI。

提出的方法

  • 对来自26个刊物(2017–2023)的40篇以上论文进行调研与综合。
  • 建立将任务(分类、检索、质量分析、生成)与AI方法(传统机器学习、神经网络、LLMs、多模态)联系起来的分类法。
  • 按专利生命周期任务组织,设有数据集、方法和评估指标等章节。
  • 讨论专利领域的多模态和生成式AI趋势。
  • 对未来研究方向和潜在数据集的建议。

实验结果

研究问题

  • RQ1自2017年至2023年,哪些AI方法被应用于专利分析任务(分类、检索、质量分析、生成)?
  • RQ2文本为主与多模态(文本+图像)方法在专利分析任务中的比较如何?
  • RQ3在基于AI的专利分析研究中,哪些数据集、评估指标和趋势是普遍存在的?
  • RQ4哪些未来方向(多模态学习、生成式AI、知识图谱)对专利分析具有潜力?

主要发现

  • AI工具在专利分类、检索、质量分析和生成方面的使用日益增多。
  • 从传统机器学习向深度学习和大型语言模型转变,且存在如SciBERT等领域特定变体。
  • 将文本、图像和元数据整合的多模态方法正成为一个新兴的研究方向。
  • 一种新颖的分类法将专利生命周期任务与AI方法及数据模态联系起来。
  • 未来方向包括多模态数据集、生成式专利AI、知识图谱,以及对生成内容的领域特定评估。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。