The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014
- 1 -
特許構成を考慮
文書類似度
基
く特許
課題
類
手段
類
推定
A Framework of Estimating Invention Task and Means from Patent Journals Based on the Document
Similarity with the Patent Journal Structures
槫松理樹
*1
Masaki Kurematsu
*1
岩手県立大学
ソ
ア情報学部
Iwate Prefectural University Faculty of Software and Information Science
In this paper, I proposed a framework of estimating invention task and means from patent journals based on the document similarity. When we use other’s invention protected by a patent without permission or violate it, we need a lot of time and load to settle this problem. Therefore it is important to research exists patent journals before submitting own patent or sealing new products. However, it is take long time to check a lot of patents. In order to support this task, I propose a new framework. This framework estimates invention task and means of new patent based on the document similarity between it and each exist patent given invention task and means by experts. This framework divides a patent into 4 parts based on the patent journal structure initially. Next, it gets the similarity of each part and integrates them. Finally, it shows invention task and means ranked in descending order by the similarity in the difference 4 orders. In order to evaluate this system, I did an experiment with an expert and small data set. In this research, invention task and means have sub categories. I evaluate this system from the viewpoint of the rank of invention task and means given by experts. 17% of the collect invention task and means with sub categories had entered in the top 10 and 49% of them without sub categories had entered in the top 10. Therefore, this experimental result shows that is it possible to use this approach to estimate invention task and means from patent journals. I will analyze experimental results, enhance this system based on the result of analysis and evaluate bigger data with experts.
1.
めに
代 表 的 知 的 産 情 報 あ 特 許 公 報 対 内 容 把 握
類 情報蓄積等を行う 要 あ 内容
把握 困難 観点 違い 結果や 類 多様 把
握 結 果等 多様 蓄 積情 報 共有 困難 等 問 題 生
い 特許公報活用 有効性 効率性を向
う 問題を解決 必要 あ
問題 対 ン ュ 支援方法
[寺岡 10][谷川 13] 提案 多く 特許 電子 書館(IPDL) [工業所有権情報 研修館 94] 代
表 う 検索 あ 多く
キ ワ 着 目 表 層 情 報 処 理 を 行 い
検 索 結 果 誤 特 許 含 検 索 精 度 課 題
残 い 現状 あ 特許
検索 主 あ 内容把握や 類 作業 依然 人手
行う 多い 特許公報活用 有効性や効率性を向
内 容 把 握 や 類 情 報 蓄 積 文 書 処 理 支 援
手法を確立 依然 求 い
一方 実務作業 目 を べ 特 許公報を読
難 い 本研究 研究協力者 あ 企業内 知的 産
部 門 特 許 公 報 を 扱 い 専 門 家 特 許 述 べ
い 課 題 手 段 を 類 比 較 対 象 特 許 課 題 び
手段 類似 い ッ い 特許
公報 内容把 握 時間 軽減を い 特
許 公 報 膨 大 あ 特 許 組 課 題 手 段
類 大 荷や労力 必要 い
以 背 景 本 論 文 特 許 公 報 利 用 支 援 一 環
特許 解決を試 課題 対 手段を推定
手法を提案 本提案手法 専門家 課題 手段を 類
特 許 対 象 特 許 類 似 度 を 特 許 構 造 を 考 慮
求 値を 課題 手段 類 推定を試
専門 家 企業 い 特許 処理 携 わ
い 実務者を意味
2.
特許処理
2.1
特許公報
構造
本研究 対象 特許 公報 ン 明 細書
構成 [ 明協会 05] ン 明 称
出 願 人 明 者 要 約 国 際 特 許 類 IPC F
記 載 い IPC 明 技 術 内 容 応 世 界 共 通
特許 類 記号 あ F 審査官 審査 利用
類記号 あ 明細書 特許請求 範 明 属 技
術 明 解 決 う 課 題 課 題 を 解 決
手 段 記 載 い ン び 明 細 書 記
載 い 内容 い ッ
何 い 述べ い 部 明確 い
IPCやF 明 解決 う 課題 課題を解決
手 段 課題 や手 段 推 定 考え
実 際 柄 表 記 異 対 象 範 異
理由 IPCやF 課題や手段 把握
困難 あ
2.2
特許
課題と手段
専門家 特許公報を熟読 前 特許 解決 う
課 題 類 課 題 を 解 決 手 段 類 を 出
結果を 権利調査 対象 要性を 断
連 絡 先 : 槫松 理樹 岩手 県 立大 学 岩 手 県 滝沢
巣 子 T L : X :
: re wae p ac p
The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014
- 2 -
要 性 高 い 特 許 確 認 を 行 う 以 後 課 題類を示 語句を課題 類 手段 類を示 語句を手段 類
呼ぶ 課題 類 手段 類 大 類 類 組
合わ 示 今回協力をい い 専門家 課題
類 対 大 類を13種 類を62種設定 組 合
わ ン数 66 あ 一 大 類 類
数 平均5.5種類 あ 一方 手段 類 い 大 類
13種 類33種 組 合わ ン数40 あ 一
大 類 類 数 平均5種類 あ
3.
特 許 構 成 を 考 慮
た 文 書 類 似 度 に 基
く 特 許
課題分類・手段分類推定システム
3.1
手法概要
本提案 概要を 示 本 大 く 文
書 変換部 文書類似度算出部 類推定部
処理手 次 示 通 あ
入力 新規特許 課題 手段 を え 課題
手段 課題や手段を 出 際 注目 ッ
を限定 用い 詳細 後述
最初 文書 変換部 い 、新規特許
を 文 書 変 換 次 方 法 文 書
課 題 手 段 類 済 特 許 類 似 度 を 文 書 類 似 度 算 出
部 求 課題 手段 類済 特許 専門家
課題 類 び手段 類を付 公開特許 あ 以後
類 済 特 許 呼 ぶ 類 い 大 類 1
類 組 課 題 手段 対 一 え
い 最 後 求 類 似 度 を 類 推 定 部 課
題 手段 各候補を出力
概要
3.2
文書ベ
トル変換部
文書 変換部 次 方法 各特許文書を文書
変換
1. 次 方法 ッ 毎 文 文字列を 出
1.1. ッ IPC FI 出願人 場合 区 記号
従い 文字列 出
1.2. 明 称 要 約 び明細 書 含 ッ
場合 各文 以 文字列を 出
連続 3文字 漢字 平仮 連続
カ カ 連続 英字 連続 数字 連続
記号文字 専門辞書 録 い 語句 代
表語 含
2. ッ 出 文字列を ア を作成
を ン 呼ぶ
3. ン 出現回数を要素 値 文書
を作成
記 1.2 利用 専門辞書 専門家 構築
辞書 あ 語句 対 代表語 記載 い
代表語 語句 概念を示 代表的 言葉 あ
形態素 く連続 3文字 先行研究 結
果[槫松13a] 基 い い
3.3
文書類似度算出部
文書類似度算出部 次 方法 文書 (V1 V2)間
類似度を算出 基本的 Cos類似度[ 02]を用い い
類似度 算出 い 特許 構造 着目 IPCやFI
部 課題 関係 部 手段 関係 部
3 ッ わ 処理を行う 専門家 権利調査
際 特許 べ 着目 い い いう知見 基 い い
ッ をわ 課題 手段 を用い
ッ 対 照合 ンを .*課題 いう う
正規表現 え い 各 ン ッ 含
条件を満 ッ を ン を対象
次 方法 類似度を算出
1. ン IPC FI 場合 類似度Cを式 (1) 求
V V 共通 数
V 数 V 数
式
2. ン 課題 を満 場合 課題 類似度 T を
式(2) 求 xti V1 V2 含 ンi
う ッ 課題 を V1 出現数
あ yti V2 出現数 あ ッ 手段
を満 場合 手段 類似度 Mを課題 類似度T
様 式(3) 求 xmi V1 V2 含
ンi う ッ 手段 を V1
出現数 あ ymi V2 出現数 あ
T ∑ xt yt
xt yt
式 M
∑ xm ym
xm ym
式
3. 記 求 値を 文書類似度Sを式(4) 求 各
専門家 話 合い 決定 い
S . C . T . M 式
3.4
分類推定方法
記 得 類 似 度 を 次 あ 方 法 課 題 手
段 類を求
(1) 最大類似度… 類済 特許 類を 類似度 降 候
補 提示
(2) 期 待 度 数 … 類 済 特 許 類 を 類 似 度 類 組
期待度 数 積 降 候補 提 示 期待度
数 式(5) 求
課題i手段j 期待度数=
課題i 類済 特許数 手段j 類済 特許数
類済 特許 総数
式
文書ベ トル
変換部 新規特許
課題タ 手段タ
文書ベ トル
変換部
文書類似度算出部
分類推定部 分類済み
特許
課題分類大分類・小分類
手段分類大分類・小分類
期待度計算 各特許に
課題大分類・課題小分類
手段大分類・手段小分類 組
1 与え い
The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014
- 3 -
(3) 平均値… 類済 特許 類を 類毎 類似度 平均降 候補 提示
(4) 個 値…課題 類似度 T 手段 類似度 M い
値 最 値 を 最大値 最 値 割
正規 課題 類 手段 類 組 正規 後
類 似 度 幾 何 平 均 降 候 補 提 示 (1)
(3) 課題 手段 組 推定 い 対 (4)
々 利用 い
4.
評価実験
4.1
実験概要
提案手法 有用性を評価 3章 示 考えを
JAVAを用い 実装 を用い 以 条件
実験を行 実装 ン ョッ を 2
示 本研究 直接関係 い機能 用意 い
実 験 い 専 門 家 え 類 済 特 許
705 件 う 173 件 特許 い 課題 手段 類 推
定 を 試 実 験 い 類 を 推 定 特 許 以 外 特
許 文書類似度 類 出を行う 課題
.*課題 手 段 .*手段 を え 課題
終わ い い ッ を課題 類似度計算
用 い 手 段 終 わ い い ッ を手 段 類
似度計算 用い
評 価 専 門 家 付 類 を 正解 何 番
目 出 評価 類 い 課題
大 類 課題 類 手段大 類 手段 類 課題大 類
手 段 大 類 課 題 大 類 課 題 類 課 題 大 類 手 段
大 類 手段 類 手段大 類 い 評価
2 ン ョッ
4.2
実験結果
表1 表3 実験結果を示 各表 い 推定手法
3.4 章 あ 類手法 あ 課題 手段 対象 目
を示 ◎ 大 類 類両方 ○ 大 類 あ
表1 正解 平均値 SDを示 表2 大
割合を示 表3 全候補 正解 置
を示 え 1~10% 1~10%以内 正解
出 現 特 許 数 を 示 今 回 推 定 を試 特 許
類 中 類 似度を求 用い 類済 特許 中
い 含 大 類 類両方を推定
場合 正解 見 い場合 あ
表2 示 う い 大 類 類を
場 合 最 大 類 似 度 個 値 平 均 期 待 度 数
大 類 最大類似度 平均 個 値 期待度数
表 示 う 個 値 大 く い
ン数 課題 手段 類 組 合わ
数 膨大 あ 大 い あ
影響を 平均値 高く う 一方 表 3
見 場 合 個 値 最 く 最 大 類似 度 平均 期待
度数
表 .実験結果 順位 平均値と SD
課題手段順位最大類似 期待度数 平均 個別値
◎ ◎ 平均 . . . .
◎ ◎ SD . . . .
◎ 平均 . . . .
◎ SD . . . .
◎ 平均 . . . .
◎ SD . . . .
○ ○ 平均 . . . .
○ ○ SD . . . .
○ 平均 . . . .
○ SD . . . .
○ 平均 . . . .
○ SD . . . .
4.3
評価・考察
全 体 大 類 ほう 高 く 手 段 ほう 課題
い結果を得 い 候補 ン 大 類 ほう
大 類 類 組 合わ 少 く 手段 ほう 課題
少 い う 結 果 考 え
今回 方法 い ン 行う場合 精度 高い
一 定 以 役 割 果 い 考 え
類 い 専 門 家 間 意 見 あ
検証 必要 あ
各手法 い 最大類似度 平均 期待度数 個 値
類推定方法 一部異 考え
最大類似度 平均 期待度数 い 各表 示 う
最大類似度 を 出 ン 全体的 い結果
い う 結果 理由 類似 特
許 類済 特許 含 い 考え 一方 過
去 例 基 、 逸 脱 組 合 わ を 避
入 期待度数を用い 方法
を マイ 効果 い
多く 可能性を考慮 を目的 入 平均値 様
あ 理由 類済 特許 類
特許数 アン ン 影響を え い 考え
手法 過去 類を文書類似度 計算 違う形
利 用 過 去 類 過 度 活 用
い 可能性 高い 期待度 計算方法を含
利用方法を検討 必要 あ
個 値を用い 最大類似度 場合
最大類似度 異 類済 特許 い課
題 類 手段 類 組 合わ を見 可能 あ
The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014
- 4 -
組 合わ ン数 多い あ ン数 膨大
あ 正解 べ ン
く 類候 補を 絞 込 考 え 大 類
場 合 他 手 法 差 少 く い 様
傾向 あ 以 結果を踏 え 個 値を用い 方法 妥当
あ 考え
本研究 先行研究[槫松 13b] い 類済
特 許 現 文 字 列 出 現 頻 度 を 利 用 方 法 を 行 本
手法 全 類済 特許 今回 文書 様 文
字 列 を 出 類 毎 出 現 頻 度 を 求 類 対
TFIDF を求 を 新規特許 対
特許中 現 文字列 対 総和を求 を
類を推 定 手 法 対 本手法 ほう 高
い 精 度 を 得 先 行 研 究 手 法 文 字 列
を求 膨大 計算 必要 点
本手法 ほう 有用 あ 評価
今回 実験 本手法 活用 可能性を示
精度 十 あ 今後 課題 次
あ 今回推定を行 い い特許 対 推定
実 験 結 果 検 証 を行 う 検 証 精 度 類
特許 特徴を専門家 議論を行い 把握
過程を通 得 専門家 知識 知見を踏 え 本手法 利
用 い 各種 設定方法や手法 再検討
再 構 築 を 進 再 構 築 対 今 回 等
評価実験を専門家 協力 実施
5.
わ
に
本 稿 権 利 調 査 特 許 公 報 処 理 支 援 を 行 う
特 許 解 決 う 課 題 手 段 候 補 を 推 定
手法を提案 本手法 大 類 類 組 合わ
表 現 課 題 類 手 段 類 を 専 門 家 前 行
課題 類 手段 類 出結果を 推定 専門家
協力 行 評価実験 い 課題 類 手段
類 組 い 10 以内 正答 含 割合 最大
大 類 類 両方 場合 約 17% 大 類 場 合 約
49% あ 今後 課題 大規模 実
証実験 語句 出 方や ッ 利用 各種
情報 出方法 検証 改善 計算 削減 あ
謝辞
評価実験 協力い い A氏 感謝 意を表
本研究 一部 科研費 基盤 C 課題番号 24500121 助成を
参考文献
[ 02] 研 他:情報検索ア 共立出版 2002
[槫松13a] 槫松理樹: 連関係 数を援用 類 似文
書検索 評価 第 12回情報科学技術 ォ E-014
pp.211-214 第2 冊 2013
[槫松13b] 槫 松 理 樹 : 専 門 家 出 結 果 を 用 い 特 許 公
報 課題手段推定支援手法 提案 人工知能学会 第
69 回 言 語 音 声 理 解 対 話 処 理 研 究 会(SIG-SLUD) pp.49-54 2013
[谷川 13] 谷川英和:特許 情報学 特許実務 情報学
献 研究者等 特許活動 情報処理学会 Vol.54
No.3 pp.192 – 199 2013
[寺岡 10] 寺 岡 岳 夫 : 特 許 情 報 検 索 現 状 今 後 Japio Year Book 2010 pp.166 - 169 2010
[工業所有権情報 研修館 94] 工業所有権情報 研修館:特許
電 子 書 館 http://www.ipdl.inpit.go.jp/homepg.ipdl 2014/3/10ア
[ 明協会05] 社 団 法 人 明 協 会 : 産 業 産 権 標 準 キ 特 編 東京書籍 2005
表 .実験結果 位以内 特許数
課題手段順位 最大類似 期待度数 平均個別値
◎ ◎ ~ 位
◎ ◎ ~ 位
◎ ◎ ~ 位
◎ ~ 位
◎ ~ 位
◎ ~ 位
◎ ~ 位
◎ ~ 位
◎ ~ 位
○ ○ ~ 位
○ ○ ~ 位
○ ○ ~ 位
○ ~ 位
○ ~ 位
○ ~ 位
○ ~ 位
○ ~ 位
○ ~ 位
表 .実験結果 上位 %以内 特許数
課題手段順位分布最大類似 期待度数 平均個別値
◎ ◎ ~ %
◎ ◎ ~ %
◎ ◎ ~ %
◎ ~ %
◎ ~ %
◎ ~ %
◎ ~ %
◎ ~ %
◎ ~ %
○ ○ ~ %
○ ○ ~ %
○ ○ ~ %
○ ~ %
○ ~ %
○ ~ %
○ ~ %
○ ~ %