ランダムフォレストを用いた特許に関する文書データからの技術適用領域に関する知識抽出

書誌事項

タイトル別名
  • Knowledge Extraction from Textual Patent Data Using a Random Forest
  • ランダムフォレスト オ モチイタ トッキョ ニ カンスル ブンショ データ カラ ノ ギジュツ テキヨウ リョウイキ ニ カンスル チシキ チュウシュツ

この論文をさがす

抄録

<p>技術情報の複雑化・多様化に伴い,専門知識が異なる技術者や意思決定者の間で技術傾向に関する情報の共有が難しくなっている.こうした中で近年,テキストマイニングに基づいたパテントマップが注目されており,これを用いることで特許データから技術に関する知識の抽出・可視化が実現されている.本研究は,複数の分野を跨いで実用の可能性に富む技術に関する情報の可視化およびそれらに関する知識抽出を行うものである.提案法では出現した単語の情報を属性とし,技術分野などに関する情報をクラスとしたランダムフォレストの学習結果の内部モデルに対する解析を通じて知識抽出を行う.知識抽出にあたり,ランダムフォレストの内部モデルから特許文書間の類似度行列を作成し,多次元尺度構成法によるマッピングを行っている.ここで得られた出力結果に対してカーネル密度推定を施すことによって,適用領域を考慮した文書ベースのパテントマップが構築できる.また,非負値行列因子分解により,単語の類似性に基づいて次元縮約することでランダムフォレストの内部モデルの解釈を与えた.分析対象にはWeb上に公開されている特許に関する文書データを用いて分析を行った.</p>

収録刊行物

詳細情報 詳細情報について

問題の指摘

ページトップへ