[論文レビュー] Technology Knowledge Graph Based on Patent Data.
本論文では、NLPおよび単語埋め込みを用いて、米国特許データ(1976年〜現在)から抽出した技術用語の意味的関係をモデル化する大規模な技術知識グラフ「TechNet」を提案する。このシステムは、設計のアイデーションや意味的検索といった高度な工学的応用を可能にし、APIおよびオンラインインターフェースを通じて公開されている。
The growing developments in general semantic networks, knowledge graphs and ontology databases have motivated us to build a large-scale comprehensive semantic network of technology-related data for engineering knowledge discovery, technology search and retrieval, and artificial intelligence for engineering design and innovation. Specially, we constructed a technology semantic network (TechNet) that covers the elemental concepts in all domains of technology and their semantic associations by mining the complete U.S. patent database from 1976. To derive the TechNet, natural language processing techniques were utilized to extract terms from massive patent texts and recent word embedding algorithms were employed to vectorize such terms and establish their semantic relationships. We report and evaluate the TechNet for retrieving terms and their pairwise relevance that is meaningful from a technology and engineering design perspective. The TechNet may serve as an infrastructure to support a wide range of applications, e.g., technical text summaries, search query predictions, relational knowledge discovery, and design ideation support, in the context of engineering and technology, and complement or enrich existing semantic databases. To enable such applications, the TechNet is made public via an online interface and APIs for public users to retrieve technology-related terms and their relevancies.
研究の動機と目的
- すべての工学分野にわたる技術的コンセプトの包括的かつ大規模な意味的ネットワークの構築を目的とする。
- 構造化された意味的関係を通じて、高度な技術検索、リtrieval、および設計のアイデーションを可能にする。
- 特許データとNLPを活用して、実世界の技術的テキストから意味的な用語の関連性をモデル化する。
- AI駆動の工学的イノベーションを支援する公開可能なインfra構築を目的とする。
- 既存の意味的データベースに、分野特化型で技術的根拠を持つ知識を補完する。
提案手法
- 自然言語処理技術を用いて、米国特許データベース全体(1976年〜現在)から用語を抽出した。
- 最近の単語埋め込みアルゴリズムを適用し、抽出された用語をベクトル化し、その意味的関係をモデル化した。
- 文脈的埋め込みに基づく用語間の対比較関連性を確立することで、意味的ネットワーク(TechNet)を構築した。
- 工学的および設計的観点から、用語関係の意味的妥当性を検証した。
- オンラインインターフェースおよびAPIを通じてTechNetをデプロイし、公開アクセスおよびアプリケーションへの統合を可能にした。
- 技術的テキスト要約やクエリ予測などの下流タスクを支援するために、知識グラフを活用した。
実験結果
リサーチクエスチョン
- RQ1大規模な特許データから、体系的かつ分野特化型の技術的コンセプト知識グラフをどのように構築できるか?
- RQ2TechNetに含まれる意味的関係は、どの程度技術的および工学的関連性を的確に反映しているか?
- RQ3TechNetは、設計のアイデーションや意味的検索といった実用的工学的応用を効果的に支援できるか?
- RQ4工学分野において、TechNetは既存の汎用的意味的データベースとどのように比較・補完できるか?
- RQ5公開特許データから構築された大規模技術知識グラフのスケーラビリティとアクセス可能性はいかがなものか?
主な発見
- TechNetは、あらゆる工学分野にわたる広範な技術的コンセプトとその意味的関係を効果的にモデル化している。
- 単語埋め込みから導出された意味的関係は、工学的および設計的観点から意味的に妥当であることが示された。
- 公開APIおよびオンラインインターフェースを通じて、技術関連用語とその対比較関連性の効果的リtrievalが可能である。
- TechNetは、技術的テキスト要約、検索クエリ予測、関係性の知識発見といった多様な応用を支援している。
- 知識グラフは公開されており、AI駆動の工学的設計およびイノベーションツールへの統合が可能である。
- 本手法は、1976年から現在までの米国特許データベース全体を処理する上でスケーラブルであることが示された。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。