• 検索結果がありません。

JOHO KANRI 2013 vol.56 no.7 Journal of Information Processing and Management October データベースについて紹介する 2. PATENTSCOPE とは ザーの利便性向上に努め

N/A
N/A
Protected

Academic year: 2021

シェア "JOHO KANRI 2013 vol.56 no.7 Journal of Information Processing and Management October データベースについて紹介する 2. PATENTSCOPE とは ザーの利便性向上に努め"

Copied!
15
0
0

読み込み中.... (全文を見る)

全文

(1)

WIPOの無料特許情報データベース

PATENTSCOPE

PATENTSCOPE: WIPO's database on patent information

夏目 健一郎

1 NATSUME Ken-Ichiro1 1 世界知的所有権機関 日本事務所 1 World Intellectual Property Organization, Japan Office 原稿受理(2013-08-01) 情報管理 56(7), 425-439, doi: 10.1241/johokanri.56.425 (http://dx.doi.org/10.1241/johokanri.56.425)

著者抄録

WIPO(世界知的所有権機関)がインターネット上,無料で提供する特許情報データベースである PATENTSCOPE は, 220 万件を超える PCT データに加えて,30 以上の国・地域の特許文献データを擁しており,総データは 3,000 万件に及び, データの数は日々増加している。検索は,論理演算子,ワイルドカード,近接演算子を用い,柔軟な検索式を立てて 行うことが可能である。検索結果を表,グラフ形式で視覚的に表示することもできる。各国語の特許文献を効率的に 検索するために,PATENTSCOPE では,検索語を 12 か国語に自動的に展開するユニークな機能である多言語検索機能 を提供する。本稿では,この PATENTSCOPE データベースについて,その特徴を概説する。

キーワード

世界知的所有権機関,WIPO,PATENTSCOPE,特許情報,特許検索,特許文献,特許データベース,無料データベース, 翻訳,PCT,多言語

1.

はじめに

世界知的所有権機関(World Intellectual Property Organization: WIPO)の統計によれば2011年の全世界 の特許出願は214万件に上り,1995年の105万件から 倍増している。また,WIPOが提供する特許協力条約 (Patent Cooperation Treaty: PCT)を利用した国際出 願は2012年には19万件を超え,1995年の4万件から5 倍近くに成長している。このように増加の一途をた どっている特許情報は,各国の知的財産当局などに よって公開され,アクセス可能である。日本におい ても,独立行政法人工業所有権情報・研修館が提供 する特許電子図書館(IPDL)を始めとして各種サー ビスが提供されている。 WIPOは186の加盟国を有するが,加盟各国の知的 財産庁からデータの提供を受け,WIPO自身が持つ PCTデータに加えて各国国内特許情報も含むデータ ベースを公開している。今回はそのPATENTSCOPE

(2)

2.

PATENTSCOPEとは

国連の専門機関であるWIPOは,知的財産権の保護 促進と加盟国間の協力を大きな目的とするが,この目 的達成のための任務としてWIPO設立条約注1)に明記さ れているものには「知的所有権の保護に関して情報を 収集し及び広報活動を行う」ことも含まれている注2) 増大する知的財産に関する情報を収集し,これを広く 提供することはWIPOとしての任務である。WIPOのカ バーする知的財産は特許に留まらず,商標,意匠,著 作権など多岐にわたるが,特許に関する情報を提供す るプラットフォームがPATENTSCOPEである。 特許情報を提供するデータベースは世の中に無料, 有料のものを含めて各種存在するが,WIPOの場合は, 日本のような先進国だけではなく途上国なども含め たすべての加盟国が対象である。したがって,公的 な国際機関としても,このようなデータベースの提 供は広く無料で行っている。 PATENTSCOPEには,PCTデータや各国知財庁から 提供を受けた国内/域内特許データが3,000万件近く 格納されている。各国の国内特許情報は国によって 異なる言語なので,複数の言語の特許情報を効率よ く検索できるインターフェースをいかに提供するか, という点は国際機関としての挑戦である。この課題 については,後述する多言語検索ツールなどでユー なお,「PATENTSCOPE」はマドリッド制度などを 通じて商標登録している注3)

3.

アクセスと収録範囲

3.1 PATENTSCOPEへのアクセス PATENTSCOPEは,WIPOのWebサイトから無料 でアクセスできる(http://patentscope.wipo.int/ search/en)。PATENTSCOPEは日本語を含めた9か国 語のユーザーインターフェースを用意しており,トッ プページの上に示されている言語リストから日本語 を選ぶことによって,日本語メニューで検索するこ とができる(図1)。一番左にMobileとあるが,これ はモバイルデバイスを念頭に置いたシンプルなイン ターフェースであり,現時点では英語のみである。 3.2 データ収録範囲 PATENTSCOPEに収録されているデータは日々増え 続けているが,2013年7月時点で,PCTデータ226万 件を始めとして,各国特許データを含めると約3,000 万件のデータを収録し,フルテキストデータも1,800 万件以上収録している。データの収録範囲は,「ヘル プ」をクリックし,プルダウンメニューの中から「デー タ収録範囲」を選択,その下層のメニュー(この場 合は,「PCT出願」,「PCT国内段階移行」と「国内特 許コレクション」が選択可能)から必要な情報を選 図1 9か国語のユーザーインターフェース

(3)

択することで最新の状況を確認できる(図2)。2012 年には日本の特許文献を,2013年には米国の特許文 献を追加し,データの拡充に努めている。今後も中 国など未収録国のデータを収録し,さらに充実させ る予定である。 3.3 マニュアル PATENTSCOPEのマニュアルは,プルダウンメ ニューから「ヘルプ」-「検索方法」-「ユーザー ガイド PATENTSCOPE」と順にたどることによりア クセスできる(図3)注4)。本稿で紹介しきれない部分 もあるので,必要に応じてマニュアルもご参照いた だきたい。

4.

検索方法

PATENTSCOPEの検索は,(1)簡易検索(Simple Search)(2)詳細検索(Advanced Search)(3)構造 化検索(Field Combination)(4)多言語検索の4つの 方法で行うことができる。 4.1 簡易検索 簡易検索は,PATENTSCOPEがデフォルトで提供す るシンプルな検索インターフェースであり,あらか じめ用意された検索フィールドから1つを選んで,検 索語を入力する。検索フィールドは,「フロントペー ジ」,「すべてのフィールド」,「フルテキスト」,「日 本語フルテキスト」,「ID番号」(公開番号,出願番号 など),「国際特許分類」,「氏名(名称)」(発明者名, 出願人名など),「公開日」が用意されている。 例えば「iPS細胞」のキーワードを入れると,シス テムが入力語を単語に分けてAND検索(iPS AND 細 胞)を実行するので「iPS細胞」という用語のみなら ず「iPS」及び「細胞」という語が離れて含まれるも のまでヒットしてしまう。これを避けるためにはキー ワード全体を二重引用符「”」で囲み「“iPS細胞”」と することで,当該文字列を1つの語として検索するこ とができる。これは簡易検索に限らず,他の検索に 図2 データ収録範囲へのアクセス 図3 マニュアルへのアクセス

(4)

検索語を入れるボックスの右にある「?」マーク をクリックすると,選択したフィールドでの検索語 の例が示されるので参考にできる(図4)。 4.2 詳細検索 詳細検索においては,複数の検索語を組み合わせ て検索することができる。検索は,フィールドコード を用いて検索対象となるフィールド(発明の名称,出 願人名,請求の範囲,明細書など)を特定し,各種 演算子(ブール演算子,近接演算子など)を用いて 検索語を組み合わせて検索式を立てることによって 行う(フィールドコード及び演算子の一覧を後掲す る)。検索式に用いる検索語の数に制限はないが,検 索語があまりに多く検索が複雑になると検索に要す る時間が長くなり,サーバーによってはタイムアウト となり検索が中断される場合がある。 デフォルトでは,検索対象国はすべての国である が,「特許庁/ PCT」という表示の右にある「Specify」 をクリックすることにより,検索対象国を指定する ことができる。図5の詳細検索画面は,PCTと日本, ブラジル,米国,南アフリカにチェックを入れて検 索対象国にした例である。また,左下にある「ツー ルチップ(ヘルプ)」のチェックボックスにチェック を入れると,マウスカーソルの動きに合わせて,適宜, 説明が表示される。画面は,「語幹処理」についての 説明がポップアップ表示されている例である。 フィールドは「ヘルプ」-「検索方法」-「フィー ルド定義」で参照可能である注5)。また,演算子を含 めて検索式を立てる際の構文については,「ヘルプ」 -「検索方法」-「検索構文」で参照可能である注6) AND,OR,NOT,ANDNOTのブール演算子,ワイ ルドカード,近接演算子などが使用可能である。こ れらとフィールドコードを組み合わせて,例えば, 発明者に「Jobs」を含み,2000年から2010年までに 公開され,英語の明細書にキーワードとして「phone」 が含まれている発明を検索する場合は, 「IN: ( Jobs) AND DP: [01.01.2000 TO 31.12.2010] AND EN_DE: (phone)」 図4 検索条件の例示 図5 詳細検索画面とヘルプのポップアップ表示

(5)

フィールド コード 例

出願人情報 PAA PAA: John US California 出願人あて名 AAD AAD: Paix

出願人あて名 (国名) AADC AADC: IT 筆頭の出願人名 PAF PAF: "smith, john" 出願人氏名 (名称) PA PA: smith 出願人国籍 ANA ANA: CN 出願人住所 ARE ARE: KR 表1 出願人に関係するフィールドコード フィールド コード 例 出願日 AD AD: [01. 01. 2001 TO 01. 01. 2005] 国内段階への移行 NPED NPED: JP2005 優先日 PD PD: [01. 04. 2033 TO 11. 11. 2007] 公開日 DP DP: [15. 05. 2005 TO 15. 15. 2008] 表2 日付/範囲に関係するフィールドコード フィールド コード 例 国際特許分類 IC IC: A07 or "G01N 33" 国際特許分類 発明情報 ICI ICI: G08 国際特許分類 付加情報 ICN ICN: "G06K 21/00" 主な国際特許分類 ICF ICF: "G06K 21/00" " 表3 国際分類に関係するフィールドコード フィールド コード 例

発明者情報 INA INA: paul, london UK 発明者あて名 IAD IAD: Seattle 発明者あて名 (国名) IADC IADC: DE

筆頭の発明者氏名 INF INF: "hamilton, Janice" 発明者氏名 IN IN: john

表4 発明者に関係するフィールドコード

フィールド コード 例 すべてのフィールド EN_ALL EN_ALL: pot 要約 EN_AB EN_AB: "electric car" 請求の範囲 EN_CL EN_CL: needle 明細書 EN_DE EN_DE: syyringe

テキスト EN_ALLTXT EN_ALLTXT: "waterproof cannula" 発明の名称 EN_TI EN_TI: "flexible tube"

出願言語 LGF LGF: JA 公開言語 LGP LGP: EN *この表は, 英語の場合の例を示している。 他の言語の場合は, EN を次の文字に置き換えることにより言語を指定可能である。 FR : フランス語, DE : ドイツ語, ES : スペイン語, JA : 日本語, RU : ロシア語, VN : ベトナム語 表5 言語に関係するフィールドコード フィールド コード 例

法定代理人情報 RPA RPA: (gearge, new port) 法定代理人あて名 RAD RAD: (colombettes) 法定代理人住所 RCN RCN: KR

筆頭の法定代理人氏名 RPF RPF: (Jons) 表6 法定代理人に関係するフィールドコード

フィールド コード 例

すべての氏名 (名称) ALLNAMES ALLNAMES: smith 出願人氏名 (名称) PA PA: smith 発明者氏名 IN IN: smith 筆頭の出願人氏名 PAF PAF: "smith, john" 筆頭の発明者氏名 INF INF: "hamilton, janice" 筆頭の法定代理人氏名 RPF RPF: jones フィールド コード 例 すべての番号及び ID ALLNUM ALLNUM: 出願番号 AN AN: 国内段階 OFNUM OFNUM: 123*US 国内公開番号 PN PN:

先の PCT 出願番号 PRIORPCTAN PRIORPCTAN: US2003 先の PCT 公開番号 PRIORPCTWO PRIORPCTWO: 2003 優先権主張番号 NP NP: 2003*

WIPO 公開番号 WO WO: YY/NN*; YY/NN; YYYY/

NN*; YYYY/NNNN 表7 氏名に関係するフィールドコード

表8 番号に関係するフィールドコード

フィールド コード 例

国内段階情報 NPA NPA: US2002 国内段階出願番号 NPAN NPAN: CA-2*

国内段階移行日 NPED NPED: US-200012*

国内段階移行種別 NPET NPET: (US-E*) 国内段階特許庁コード NPCC NPCC: JP 表9 PCT国内段階に関係するフィールドコード という検索式を立てればよい。 PATENTSCOPEの特徴として近接演算子が利用でき ることが挙げられよう。 「solar AND car」という検索式では1万件以上の文 献がヒットする。ここで近接演算子を用いて「solar NEAR5 car」とすることにより,数百件程度まで絞り 込むことができる。「NEAR5」とすることで「solar」 と「car」が5単語以内の近傍にあるものを検索する。 「NEAR」の後ろにつける数で近傍の単語数を指定す る(例:NEAR100)。 また,次のように近接演算子,ブール演算子等を 複数用いて,入れ子構造にすることも可能である。 「(((“音” OR “音響” OR “ノイズ” OR “声”)NEAR4(“遮断” OR “防止” OR “障壁” OR “耐性”))OR(“防音” OR “無 音”))NEAR3(“壁” OR “パネル” OR “隔離”)」 PATENTSCOPEで使用可能なフィールドコード及び 演算子の一覧を以下に示す(表1 ~ 12)。

(6)

4.3 構造化検索(Field Combination) 詳細検索は,すべてのフィールド,演算子を駆使 して自由に検索式を立てることができるという意味 で強力な検索手法であるが,一方でフィールド,演 算子をすべて使いこなすのは必ずしも簡便ではない, と感じるユーザーもいるかもしれない。 構造化検索においては,詳細検索で利用可能な各 種の検索フィールドを選択可能なリストとしてド ロップダウンメニューに用意し,これらをANDもし くはORで組み合わせることによって,詳細検索と完 全に同じとまではいかないものの,簡易検索に比べ てはるかに幅広い検索をすることができる。 図6は発明の名称に「幹細胞」を含み,かつ,明細 書の中に「再生」という語を含む特許文献を検索す 表12 演算子一覧 フィールド コード 例 特許庁コード OF OF: JP 特許庁コード OF OF: WO 国 CTR CTR: CU 演算子 例 説明 ブール         常に大文字で使用。

AND train AND plane 最初の単語と 2 番目の単語の両方を含むすべての文献を返す。 OR train OR plane 最初の単語又は 2 番目の単語を含むすべての文献を返す。

NOT train NOT plane 最初の単語を含み, NOT の後の単語を含まないすべての文献を返す。 単項演算子としても使用可。

AND NOT train AND NOT plane 最初の単語を含み, かつ NOT の後の単語を含まないすべての文献を返す。 NOT と異なり, 二項演算子として用いる。

ワイルドカード

? te?t test 又は text を含むすべての文献を返す。 ワイルドカード検索は, ? を使用して, その 1 文字を置き換えた用語を検索する。

* electr

*

elec*ty

electric, electrics, electrical, electricity を含むすべての文献を返す。 electricity を含むすべての文献を返す。

ワイルドカード検索は, 用語の中央又は最後に*を使用して, 0 文字以上を置き換 えた用語を検索する (*を用語の最初の文字として使用することはサポートされて いない)。

その他

^ power^10 nuclear “power” が “nuclear” よりも関連性が高いとみなされるすべての文献を返す。 ブースティングは, 個々の検索用語に重要性の値を割り当てる。

+/- +electric-power

electric を含み, かつ power を含まないすべての文献を返す。

フィルター検索を使用すると, (+) 検索用語を要求し, かつ (-) 検索用語を禁止す ることができる。

~ roo~ あいまい検索は, room, roof, root などを含むすべての文献を返す。 ( ) (spaghetti OR plate)

AND fork

spaghetti 又は plate のいずれかを含み, かつ fork を含むすべての文献を返す。 グループ分けは, サブ検索式を形成する句をグループ分けするために使用される。

~/NEAR “heart monitoring”~10 Heart NEAR monitoring

近傍検索を使用すると, 単語間の近傍度を指定することができる。 この例では, チルダ (「~」 波線符号) を使用して, “heart” と “monitoring” の間 を 10 単語だけ離す。 NEAR は, デフォルトでは, 複数の単語を 5 単語だけ離す。 [ ] [01. 01. 2000 TO 01. 01. 2001] 01. 01. 2000 から 01. 01. 2001 までの範囲内にある日付を含むすべての文献を返す。 範囲検索は, [ ] を使用して, 境界を含める。

{ } {Smith TO Townsend} 氏名が Smith から Townsend までの範囲内にあり, Smith と Townsend を含まない すべての文献を返す。 範囲検索は, { } を使用して境界を除外する。 フィールド コード 例 優先権に関する情報 PI PI: 2005 KR 優先権主張国 PCN PCN: ZA 優先日 PD PD: [01. 04. 2003 TO 11. 11. 2007] 優先権主張番号 NP NP: [01. 04. 2003 TO 11. 11. 2007]

(7)

図6 構造化検索の例 る例である。 検索語を入れるボックスには,1つのキーワードの みならず,「幹細胞 OR 再生」といった検索式を入力 することも可能である。なお,演算子を指定せず複 数のキーワードを単純にスペースで区切って入力す るとAND検索が実行される。 1つのボックスには全角で100文字まで入力が可能 であるので(2013年8月時点),詳細検索で紹介した ような「(((“音” OR “音響” OR “ノイズ” OR “声”) NEAR4(“遮断” OR “防止” OR “障壁” OR “耐性”)) OR(“防音” OR “無音”))」といった検索式を1つのボッ クスに入力することも可能である。

5.

検索結果の表示と自動翻訳

5.1 検索結果 PATENTSCOPEで検索式を入力し,検索ボタンを押 して検索を実行すると,次のように検索結果が示さ れる(図7)。 検索の結果ヒットした文献が,国・発明の名称・ 出願番号・出願人等の書誌的事項と要約をセットに して示される。デフォルトでは「関連性」の高いも のから順に示しているが,「並べ替え」のプルダウン メニューから選ぶことにより,公開日・公知日につ いて新しい順もしくは古い順に並べ替えることがで きる。 5.2 文献のスクリーニング 文献番号をクリックすることにより各文献にアク セスすることができる(図8)。 上部のタブをクリックすることにより当該文献の 各種情報(「PCT書誌情報」,「明細書」全文,「請求の 範囲」等)にアクセスすることができる。「書類」か らはPCT国際調査報告,見解書やその他の手続きのた めにやり取りされた書類で公開されたものを参照す ることができる。 「明細書」や「特許請求の範囲」からは,明細書 全文などにアクセスできるが,これらにおいては Google,Microsoftの翻訳ツール(図8の「Machine translation」とある部分)を用いて,表示された内容 を日本語を含む各国言語に機械翻訳することができ る。これらの翻訳は法的手続きの根拠とできる位置 づけではないが,どのような内容が開示されている のかを把握するという観点からは有用であると考え

(8)

図7 検索結果の表示

(9)

図9 検索結果の分析(表形式の表示) ている。したがって,この機械翻訳で粗くふるいに かけて,その上で必要なものにはより精度の高い翻 訳をするといった形で絞り込みをすることができる。 「明細書」タブから明細書の全文テキストにアクセ スできるが,文献によっては,テキスト情報がOCR 処理によって作製されているものがある。この場合 も,法的な用途にはテキスト化のベースになってい るPDF版(「書類」タブからアクセス可能)を利用す ることが求められるので留意が必要である。 5.3 国内移行情報 PCT出願に関しては,国際出願した後,どの国に国 内移行したのかという情報を,競合他社の動向を探 る意味からも知りたい,という要望はあると思われ る。「国内段階」のタブをクリックすることにより, どの国に移行したのか,その後各国での審査がどう なったのかについての情報を得ることができる。た だし,国内段階情報は各国知財庁から提供される情 報に基づいているので,国によってはデータが提供 されるまでに時間を要する場合があることに注意が 必要である。どの国がいつまでの国内段階情報を提 供しているのかということは,「ヘルプ」-「データ 収録範囲」-「PCT国内段階移行」により確認できる。 5.4 検索結果の分析 PATENTSCOPEで検索を行った場合,「検索結果の 分析」の右側にある「>>」をクリックすると,検索 結果を表・グラフで表示させることができる。検索 結果を自分で加工して詳細に分析することも可能で あるが,PATENTSCOPE上で検索結果をすぐに視覚化 して表示することができるので,傾向をその場で把 握したい場合には便利である。 図のように,どの国に出願されているのか,主要 な国際特許分類は何か,主要な出願人・発明者・公 開年別の件数が表形式で一覧できる。図9はキーワー ド「携帯電話」の多言語検索(CLIR)を用いて各国 特許文献を検索した結果である。 この結果を円グラフ,棒グラフにして表示させる ことができる(図10)。 このように,例えば携帯電話分野でどの国に多く 特許出願がなされているのかを視覚的に把握するこ とができる。 棒グラフを選択すればグラフの形式を変えることが でき,図11のように経年変化を把握することができる。 この例では,「携帯電話」というキーワードで検索 したが,これを特定の企業の出願に絞ることにより, 競合他社の出願動向を調べたりすることもできる。 また,国際特許分類を検索キーとすることで特定の 技術分野における動向を分析することも可能である。

(10)

6.

多言語検索

PATENTSCOPEはPCTの国際公開公報のみならず世 界各国の国内特許情報も収録しているが,これらの 言語は国によって異なる。日本は日本語,米国は英語, EPOは英語,仏語または独語,ロシアはロシア語,と いった具合である。これらの特許文献を検索するに は,それぞれの言語で検索語を入力しなくては特許 文献をヒットさせることはできない。1つのキーワー ドで検索するにしても,各国語で何度も検索するの は煩雑であり,より簡便に検索できることが望まれ る。このような要請に対するWIPOの1つの回答が多 言語検索である。Cross Lingual Information Retrieval の頭文字を取ってCLIR(クリア)注7)と呼んでいる。 CLIRでは,1つの言語で検索語を入力することにより, 検索語とその類義語が各国語(12か国語)に自動的 図10 検索結果の円グラフ表示 図11 検索結果の棒グラフ表示 図12 多言語検索(CLIR):検索用語の入力 に翻訳され,複数の言語の特許文献を一気に検索す ることができる。12か国語は具体的には次の言語で ある。中国語・オランダ語・英語・フランス語・ド イツ語・イタリア語・日本語・韓国語・ポルトガル語・ ロシア語・スペイン語・スウェーデン語。したがって, これらの言語の1つ,例えば日本語で検索語を入力す るだけで,この12か国語で公開されている特許文献 をまとめて検索することができる。 以下に,CLIRの仕組みを紹介する。 6.1 CLIRによる検索語の入力 まずは検索語の入力である。「検索言語」をプルダ ウンメニューから選択し(ここでは「日本語」を選択), ボックスに検索語を入力する(「太陽電池」と入力)(図 12)。 次に検索式の展開の程度を選択する。スライダー

(11)

を左右に動かすことにより,調整ができる。「正確性 を高める」にスライダーを動かすと,入力された検 索語を最も関連性の高い結果を取得するための検索 式に展開する。したがって,ノイズが減ることが期 待できるが,場合によってはヒットさせたい特許文 献が漏れてしまう可能性がある。一方,「網羅性を高 める」に動かすと,入力された検索語をより多くの 結果を得るための検索式に展開する。精度が落ちノ イズが増える可能性があるが,より網羅的に特許文 献をヒットさせることができる。 ここで「拡張モード」を選択するが,「自動」を選 択した場合は,検索をクリックすれば即座に検索結 果が得られる。「拡張モード」を(手動での)「設定」 とした場合,さらにいくつかの設定をすることがで きる。 6.2 技術分野の選択 「拡張モード」が「設定」の場合,まず技術分野を 選択する。PATENTSCOPEは入力された検索語から関 連する技術分野のリストを自動的に表示する。ユー ザーはこの自動表示されたリストに他の技術分野を 加えたり,リストから不要なものを削除したりする ことができる。この技術分野は,その後,検索語を 類義語に展開する際に考慮される(図13)。 6.3 類義語展開 次 に 検 索 語 を 類 義 語 に 展 開 す る の で あ る が, PATENTSCOPEが類義語の候補を示してくれる(図 14)。ここでスライドバーを「より少なく」もしくは 「より多く」の方に移動することにより,示される類 義語の候補の数を調整することができる。 そして示された類義語の中から実際に検索に使い たいものにチェックマークを入れて類義語を決定す る。この際,表示された類義語の上にカーソルを合 わせると,当該類義語に該当する件数が示されるの で,選択の際に参考にできる。その後「選択された 図13 多言語検索(CLIR):技術分野の選択

(12)

図14 多言語検索(CLIR):類義語展開 検索用語を翻訳する」ボタンをクリックするとこれ らの類義語が12か国語に翻訳される。 類義語の展開は,PCT出願の発明の名称及び要約 から構成される特許コーパスをベースにした辞書 を用いて行っている。この辞書は,国際特許分類 (International Patent Classification: IPC)に基づいた 技術分野における統計も踏まえている。 6.4 検索対象フィールドの指定 12か国語に翻訳された類義語は12か国語それぞれ のタブをクリックすることにより,確認することが できる。各国語に明るいユーザーはそれぞれの言語 で翻訳が適切かどうかを確認し,不要なものを削除 したり,修正したりすることもできる。次に,検索 対象とするフィールドを選択する(図15)。フィール ドとしては「発明の名称」,「要約」,「発明の名称・ 要約」,「明細書」,「請求の範囲」,「発明の名称・要 約・請求の範囲」そして「すべてのテキスト」から 選択が可能である。最も網羅的に検索しようとする のであれば「すべてのテキスト」を選択すればよいし, クレーム(「請求の範囲」)に的を絞るのであれば「請 求の範囲」を選択すればよい。 そして,該当する単語間の近傍度の範囲を指定す る。「文」,「段落」,「ページ」,「制限なし」などを選 ぶことができる。さらに語幹処理のオプションが選 択可能である。このチェックボックスが選択された 状態で,例えば「swim」が検索語にある場合には, 「swimmer」,「swimmers」,「swimming」などの単 語も含め検索される。逆にこれらを検索対象から除 外して「swim」のみを検索対象としたい場合には語 幹処理のチェックボックスを解除すればよい。 以上の設定をしたら,「検索」ボタンをクリックし て検索結果を得る(図16)。 検索語が各国語に翻訳された検索式がシステムに 入力され,検索結果が得られる。各文献をスクリー ニングできるが,ヒットする文献は12か国語の文献 が入り混じったものである。必要に応じてGoogle, Microsoftの自動翻訳を活用して内容を把握すること

(13)

図15 多言語検索(CLIR):検索対象フィールドの指定 図16 多言語検索(CLIR):検索結果 ができる。

7.

ユーザー登録によるオプション機能

PATENTSCOPEは特段のユーザー登録をしなくても 無料で検索をすることができる。しかし,ユーザー 登録をすることによりいくつかの追加機能が使える ようになる。ユーザー登録は無料で,電子メールア ドレスとパスワードを自身で設定することにより簡 単に利用できる。 ユーザー登録をすることによって,検索結果のダ ウンロードが可能になる。100件までの制限はあるが, 公開番号・公開日・発明の名称・要約・出願人・発明者・ 代表図面をExcel形式で保存できる。 また,検索履歴を参照することができ,さらに検 索式を登録し,後日呼び出して再利用することがで きる(図17)。 検索式を登録し,定期的に検索することにより,

(14)

vol.56 no.72013 J o u r n a l o f I n f o r m a t i o n P r o c e s s i n g a n d M a n a g e m e n t JOHO KANRI October

情報管理

http://johokanri.jp/ 図16 多言語検索(CLIR):検索結果 17 検索履歴の保存と検索式の登録 図17 検索履歴の保存と検索式の登録

本文の注

注1) 世界知的所有権機関を設立する条約。http://www.wipo.int/treaties/en/convention/ からアクセス可 能。日本語は以下からアクセス可能。http://www.mofa.go.jp/mofaj/gaiko/treaty/pdfs/B-S50-0001_1. pdf, http://www.mofa.go.jp/mofaj/gaiko/treaty/pdfs/B-S50-0001_2.pdf, http://www.jpo.go.jp/shiryou/ s_sonota/fips/wipo/cew/mokuji.htm。 注2) 世界知的所有権機関を設立する条約第4条(vi)。 注3) マドリッド国際商標登録879539号など。 注4) http://www.wipo.int/export/sites/www/freepublications/ja/patents/434/wipo_pub_l434_08.pdfにて 直接アクセスも可能。 注5) http://patentscope.wipo.int/search/ja/help/fieldsHelp.jsfにて直接アクセス可能。 注6) http://patentscope.wipo.int/search/ja/help/querySyntaxHelp.jsfにて直接アクセス可能。 注7) http://patentscope.wipo.int/search/clir/clir.jsp?interfaceLanguage=jaにて直接アクセス可能。 特定の企業の出願動向,技術分野の出願動向などを 容易に定点観測することができる。

8.

おわりに

PATENTSCOPEでは,検索にとどまらず,翻訳機能, 第三者情報提供などの機能も備わっている。紙幅の 関係で今回は検索に的を絞って紹介させていただい た。各種の特許情報検索ツールが存在するが,多数 の言語の特許文献を検索するための多言語検索など ユニークな機能もある。「習うより慣れろ」とよく言 うが,PATENTSCOPEのユーザーインターフェースは 直感的に使えるようなものが多い。インフォプロの 方々にもご活用いただければ幸いである。

(15)

Author Abstract

PATENTSCOPE, WIPO's patent information database available online free of charge, holds more than 2.2 million PCT data and national/regional patent information. The total collection amounts to almost 30 million and is increasing. PATENTSCOPE allows users flexible retrieval with Boolean operators, wildcard and proximity operators. It can easily visualize search results in the form of tables and graphs. In order to achieve efficient retrieval on patent documents in different languages, PATENTSCOPE provides unique functions of Cross Lingual Information Retrieval, which automatically translates inputted queries into 12 languages. In this article, an overview of PATENTSCOPE is presented.

Key words

World Intellectual Property Organization, WIPO, PATENTSCOPE, patent information, patent retrieval, patent document, patent database, free database, translation, PCT, multi-language

参照

関連したドキュメント

※ 硬化時 間につ いては 使用材 料によ って異 なるの で使用 材料の 特性を 十分熟 知する こと

たとえば、市町村の計画冊子に載せられているアンケート内容をみると、 「朝食を摂っています か 」 「睡眠時間は十分とっていますか」

はありますが、これまでの 40 人から 35

荒天の際に係留する場合は、1つのビットに 2 本(可能であれば 3

基準の電力は,原則として次のいずれかを基準として決定するも

と判示している︒更に︑最後に︑﹁本件が同法の範囲内にないとすれば︑

原則としてメール等にて,理由を明 記した上で返却いたします。内容を ご確認の上,再申込をお願いいた

自然言語というのは、生得 な文法 があるということです。 生まれつき に、人 に わっている 力を って乳幼児が獲得できる言語だという え です。 語の それ自 も、 から