• 検索結果がありません。

JAIST Repository: 我が国の大学・公的機関に関する情報のアーカイブ化 : NISTEP大学・公的機関名辞書の整備

N/A
N/A
Protected

Academic year: 2021

シェア "JAIST Repository: 我が国の大学・公的機関に関する情報のアーカイブ化 : NISTEP大学・公的機関名辞書の整備"

Copied!
6
0
0

読み込み中.... (全文を見る)

全文

(1)

JAIST Repository

https://dspace.jaist.ac.jp/

Title

我が国の大学・公的機関に関する情報のアーカイブ化

: NISTEP大学・公的機関名辞書の整備

Author(s)

小野寺, 夏生; 伊神, 正貫; 富澤, 宏之

Citation

年次学術大会講演要旨集, 30: 1036-1040

Issue Date

2015-10-10

Type

Conference Paper

Text version

publisher

URL

http://hdl.handle.net/10119/13450

Rights

本著作物は研究・技術計画学会の許可のもとに掲載す

るものです。This material is posted here with

permission of the Japan Society for Science

Policy and Research Management.

(2)

2I19

我が国の大学・公的機関に関する情報のアーカイブ化

-1,67(3 大学・公的機関名辞書の整備-

 小野寺夏生○伊神正貫,富澤宏之(文科省・NISTEP) 





㻝㻚㻌 はじめに㻌 我が国における研究開発の動向を把握し、研究開発 に関する方針・政策を国レベル、機関レベルで検討す る上で、研究開発を行っている機関に関する情報は、 最も基盤的なデータの一つである。研究機関の研究イ ンプットや研究アウトプットのデータを得るための情報源 はいろいろ存在するが、これらの情報源を用いて機関 別にデータを整理・分析しようとすると種々の困難に直 面する。㻌 科学技術・学術政策研究所㻔㻺㻵㻿㼀㻱㻼㻕では、このような 困難を低減し、研究開発に関するミクロ分析を支援する ために、我が国の研究開発機関(大学と公的機関に重 点)の基本的情報を収録する「㻺㻵㻿㼀㻱㻼 大学・公的機関 名辞書」(以下「機関名辞書」という)の作成に取り組ん でいる。この事業は、㻞㻜㻝㻝 年度から行われている文部 科学省の「科学技術イノベーションにおける“政策のた めの科学”推進事業」の一環としての「データ・情報基盤 の構築」の一部であり、研究開発に関する機関の基本 的な情報を継続的に取得し、アーカイブ化することを目 標としている。㻌 機関名辞書については第 㻞㻤 回の本大会で一部報告 した㼇㻝㼉が、本発表ではその後の進捗、特に主要大学の 下部組織(部局)情報の整備に重点を置いて、その構 成と内容、機関・組織の情報を収集する方法について 報告する。また、その活用例として、論文データベース 中の所属機関の同定の方法と結果の概要を報告する。㻌 㻺㻵㻿㼀㻱㻼 では、機関名辞書を各方面で活用していた だくべく、関連のデータとともに公開している㼇㻞㼉。㻌 㻌 㻞.機関名辞書の構成と内容㻌 機関名辞書には、研究開発を行っている日本の機関 (以下「代表機関」という)とその主な下部組織の名称 (日本語と英語)、所属セクター、階層関係、変遷等の 情報を収録する。機関名辞書の最新版㻔㻞㻜㻝㻡 年 㻡 月バ ージョン㻕に収録されている機関数を表 㻝 に示す。㻌 㻞㻚㻝㻌 収録する機関と下部組織㻌 㻔㻝㻕㻌 代表機関㻌 ① 現存する全ての大学、短期大学、高等専門学校、 大学共同利用機関、及び学校法人㻌 ② 研究開発を行っている国の機関、特殊法人・独立 行政法人㻔国立研究開発法人を含む㻕、地方公共団 体の機関、非営利法人、その他の機関(日本所在 の国際機関等)㻌 ③ ①または②のセクターに属し、この 㻝㻡 年ほどの間に 統廃合、名称変更等があって現存しない機関のう ち主要なもの㻌 (上記には民間企業が含まれていないが、これについ ては 㻞㻚㻠 を参照)。㻌 㻔㻞㻕㻌 下部組織㻌 上記の代表機関に属する以下の下部組織(現存しな いものも含む)を収録する。原則として第 㻞 階層下部組 織(代表機関の直下の下部組織)までを対象とする㻝。図 㻝 に代表機関㻙第 㻞 階層下部組織㻙第 㻟 階層下部機関 の関係性のイメージを示した。㻌 ① 研究論文数の特に多い大学の部局(㻞㻚㻟 参照)。㻌 ② 大学に属する病院、及び共同利用・共同研究拠点 となっている部局。これらについては第 㻟 階層下部 組織(医学部の附属病院のように第 㻞 階層下部組 織の下の組織)であっても収録対象とする。㻌 ③ 大学共同利用機関である 㻠 つの機構に直属する研 究所等。㻌 ④ 国の機関及び特殊法人・独立行政法人等に所属 する病院、大学校、及び研究開発活動の分析の観 点から重要なその他の下部組織。㻌 㻌 図 㻝㻌 代表機関㻙第 㻞 階層下部組織㻙第 㻟 階層下部機関㻌 の関係性のイメージ㻌 例: 東京大学 大学院理学系研究科 物理学専攻 代表機関 (第1層) 下部組織 (第2層) 下部組織 (第3層~) 㻌 㻌 㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌 㻝なお、つぎの機関は下部組織ではなく代表機関としている。㼍㻕㻌 大学の一部と しての短期大学部、高等専門学校、㼎㻕㻌 国立高等専門学校:独立行政法人国立 高等専門学校機構の下の組織であるが、個々の高専を代表機関としている、㼏㻕㻌 国立試験・研究機関:但し、試験・研究機関に属しない国の機関(気象庁高層 気象台、厚生労働省の検疫所等)は、属する省庁の下部組織とする、㼐㻕㻌 地方 公共団体の公設試験研究機関等。㻌

(3)

表 㻝㻌 機関名辞書㻔㻞㻜㻝㻡 年 㻡 月バージョン㻕に収録されている機関数㻌 セクター㻌 現存機関㻌 非現存機関㻌 代表機関㻌 下部組織㻌 小計㻌 代表機関㻌 下部組織㻌 小計㻌 国立大学㻌 㻤㻢㻌 㻝㻞㻢㻤㻌 㻝㻟㻡㻠㻌 㻝㻡㻌 㻝㻞㻞㻌 㻝㻟㻣㻌 国立短大㻌 㻌 㻌 㻌 㻞㻢㻌 㻌 㻞㻢㻌 国立高専㻌 㻡㻝㻌 㻌 㻡㻝㻌 㻤㻌 㻌 㻤㻌 公立大学㻌 㻤㻡㻌 㻢㻜㻌 㻝㻠㻡㻌 㻝㻢㻌 㻝㻌 㻝㻣㻌 公立短大㻌 㻝㻣㻌 㻌 㻝㻣㻌 㻠㻡㻌 㻌 㻠㻡㻌 公立高専㻌 㻟㻌 㻌 㻟㻌 㻠㻌 㻌 㻠㻌 大学共同利用機関㻌 㻠㻌 㻞㻠㻌 㻞㻤㻌 㻟㻌 㻌 㻟㻌 国の機関㻌 㻠㻜㻌 㻥㻌 㻠㻥㻌 㻡㻣㻌 㻣㻌 㻢㻠㻌 特殊法人・独立行政法人㻌 㻤㻤㻌 㻞㻞㻠㻌 㻟㻝㻞㻌 㻟㻣㻌 㻞㻥㻌 㻢㻢㻌 地方公共団体の機関㻌 㻢㻤㻡㻌 㻌 㻢㻤㻡㻌 㻥㻜㻌 㻌 㻥㻜㻌 学校法人㻌 㻢㻢㻟㻌 㻌 㻢㻢㻟㻌 㻝㻌 㻌 㻝㻌 私立大学㻌 㻢㻝㻞㻌 㻟㻢㻠㻌 㻥㻣㻢㻌 㻠㻝㻌 㻝㻣㻌 㻡㻤㻌 私立短大㻌 㻟㻠㻝㻌 㻌 㻟㻠㻝㻌 㻞㻞㻟㻌 㻌 㻞㻞㻟㻌 私立高専㻌 㻟㻌 㻌 㻟㻌 㻌 㻌 㻌 会社㻌 㻌 㻌 㻌 㻌 㻌 㻌 非営利団体㻌 㻟㻡㻢㻥㻌 㻌 㻟㻡㻢㻥㻌 㻟㻝㻣㻌 㻌 㻟㻝㻣㻌 その他㻌 㻡㻌 㻌 㻡㻌 㻌 㻌 㻌 計㻌 㻢㻞㻡㻞㻌 㻝㻥㻠㻥㻌 㻤㻞㻜㻝㻌 㻤㻤㻟㻌 㻝㻣㻢㻌 㻝㻜㻡㻥㻌 㻌 㻞㻚㻞㻌 機関名辞書に収録する情報㻌 上記に該当する代表機関及び下部組織に対する以 下の情報を収録する。㻌 ① 㻺㻵㻿㼀㻱㻼 が与える機関 㻵㻰(代表機関、下部組織のそ れぞれに独立して与える)㻌 ② 日本語と英語の正式名㻌 ③ 所属するセクター(㻝㻣 に分類、表 㻝 を参照)㻌 ④ 下部組織とそれが属する代表機関とのリンク㻌 ⑤現存しない代表機関、下部組織の変遷情報(移 行の種別、移行年月日、継承先がある場合その 機関)㻌 ⑥郵便番号㻌 㻞㻚㻟㻌 下部組織レベル情報の付加の必要性㻌 研究開発の動向を把握するとき、下部組織レベル (大規模な総合大学の学部・大学院研究科等の単位や 大学共同研究機関に属する研究所単位など)での調 査・分析が重要な場合がある。㻞㻚㻝㻔㻞㻕で示したように、重 要な下部組織も収録することが機関名辞書の一つの特 徴である。特に、大学下部組織情報のアーカイブ化を 一つの重要な目標とし、当面、㻝㻥㻥㻢~㻞㻜㻝㻜 年の期間の 論文数(㻿㼏㼛㼜㼡㼟 のデータによる)に基づいて選定した 㻟㻞 大学の第 㻞 階層下部組織(事務組織を除く)の情報を網 羅的に収録している。これらの大学と収録されている下 部組織数(㻞㻜㻝㻠 年度の現存している下部組織のみ)を 表 㻞 に示す。㻌 㻌 表 㻞㻌 機関名辞書㻔㻞㻜㻝㻡 年 㻡 月バージョン㻕に収録されている 㻟㻞 大学の下部組織数㻌 大学㻌 下部㻌 組織数㻌 大学㻌 下部㻌 組織数㻌 北海道大学㻌 㻤㻢㻌 大阪大学㻌 㻢㻠㻌 東北大学㻌 㻣㻥㻌 神戸大学㻌 㻠㻞㻌 筑波大学㻌 㻢㻣㻌 岡山大学㻌 㻡㻡㻌 群馬大学㻌 㻞㻝㻌 広島大学㻌 㻡㻟㻌 千葉大学㻌 㻠㻤㻌 徳島大学㻌 㻟㻥㻌 東京大学㻌 㻣㻠㻌 九州大学㻌 㻝㻟㻠㻌 東京医科歯科大学㻌 㻞㻢㻌 長崎大学㻌 㻟㻡㻌 東京工業大学㻌 㻢㻣㻌 熊本大学㻌 㻟㻤㻌 東京農工大学㻌 㻞㻠㻌 大阪市立大学㻌 㻟㻡㻌 新潟大学㻌 㻞㻣㻌 大阪府立大学㻌 㻞㻠㻌 富山大学㻌 㻟㻢㻌 慶應義塾大学㻌 㻡㻟㻌 金沢大学㻌 㻡㻜㻌 東海大学㻌 㻣㻝㻌 信州大学㻌 㻟㻜㻌 東京理科大学㻌 㻟㻝㻌 岐阜大学㻌 㻞㻣㻌 日本大学㻌 㻡㻝㻌 名古屋大学㻌 㻢㻣㻌 早稲田大学㻌 㻥㻜㻌 京都大学㻌 㻣㻜㻌 近畿大学㻌 㻡㻢㻌 注㻦㻌 国立、公立、私立の順番で地域順に示している。㻌 㻞㻚㻠㻌 機関名辞書の補助情報㻌 機関名辞書には、㻞㻚㻝 及び 㻞㻚㻞 に示した収録基準を 満たさないが、㻺㻵㻿㼀㻱㻼 内部での機関同定や分析の作 業上必要性が高い次のような情報を補助情報として含 んでいる。これらの情報は、公開される機関名辞書には

(4)

含まれない。㻌 㼍㻕 㻞㻚㻝 に該当する代表機関及び下部組織の正式名称 以外の名称(日本語及び英語の別名、略称、表記 ゆれデータ等)㻌 㼎㻕 㻞㻚㻝 に該当しない代表機関・下部組織に関する 㻞㻚㻞 に相当する情報㻌 具体的には以下の機関・組織が該当する。㻌  民間企業(代表機関、下部組織とも)㻌  㻞㻚㻝㻔㻝㻕に示す代表機関の下部組織で、㻞㻚㻝㻔㻞㻕に 該当しないもの㻌 民間企業を公開情報に含めていない理由は、別途 に構築、公開している 㻺㻵㻿㼀㻱㻼 企業名辞書に、我が国 の企業に関する主要な情報が収録されているためであ る。㻌 補助情報に含まれる下部組織や正式名称以外の機 関名称は、同定漏れや誤同定の原因を防止するために 収録されている場合が多く、収録に明確な基準がある わけではないため、公開の機関名辞書には含めていな い。しかし、よく使われる別名や略称は「大学・公的機関 名英語表記ゆれテーブル」として公開している㼇㻞㼉。㻌 㻌 㻟.機関名辞書整備のための情報収集㻌 㻟㻚㻝㻌 大学と国に関係する機関㻌 㻔㻝㻕㻌 代表機関の情報㻌 大学、短大、高専、大学共同利用機関、国の機関、 特殊法人・独立行政法人、学校法人の各セクターに属 する代表機関については、毎年少なくとも 㻝 回、府省等 の 㼃㼑㼎 サイトのリストを調べて存在を確認し、機関名辞 書に対し以下の更新処理を行う。㻌 ① 新しくリストに記載された機関を辞書に登録し、その 機関の 㼃㼑㼎 サイトあるいは他の情報源から必要な 情報を入手する。㻌 ② リストからなくなった機関については、変遷の区分 (統合、廃止、名称変更の 㻟 種に分類)、変遷年月 日、継承機関(あれば)を調査し、その情報を辞書 に追加する。㻌 㻔㻞㻕㻌 下部組織の情報㻌 機関名辞書に含まれる下部組織については、少なく とも年1回、それぞれが属する代表機関の 㼃㼑㼎 サイトで 存否を確認する。新しい組織、存在しなくなった組織に ついては、代表機関の場合と同様の調査を行う。㻌 㻞㻚㻟 に示した 㻟㻞 大学の部局情報の収集も基本的にこ の方法によるが、第 㻞 階層組織を網羅的に収録するた め特に注意深く行っている。そのため、各大学の部局 情報を入手する 㼃㼑㼎 ページ(多くは大学概要のサイトに ある組織のページ)を規定し、このページの記載に基づ き、辞書に登録すべき部局を識別する。これらの 㼃㼑㼎 ページから英語名称や変遷情報を得られない場合は 別のページを調査する。㻌 㻟㻚㻞㻌 地方公共団体の機関、民間企業、非営利法人に属 する機関㻌 機関名辞書の作成を開始した 㻞㻜㻝㻝 年に、これらのセ クターに属する機関は主に「全国試験研究機関名鑑」 (㻞㻜㻜㻤㻛㻞㻜㻜㻥 年版)㼇㻟㼉に基づいて選択した。その後は、 主要な非営利団体について財団・社団法人から公益あ るいは一般財団・社団法人への移行に関する一斉調査 を行った例を除けば、気が付いた時点で適宜、機関の 新登録、変遷情報の追加、英語名の追加や変更を行っ ている程度である。今後は、現状をより正確に把握する ため、少なくとも数年に 㻝 回程度調査とデータ更新を行 う必要があろう。㻌 ここで示した方法以外に、㻠 で述べる論文データベー スの機関同定によりデータ更新に重要な情報が得られ る。同定できなかった所属機関データによく出現する表 記から、機関名辞書に未登録の機関や下部組織、未収 録の英語別名や機関略称の情報が得られる。㻌 㻌 㻠.機関名辞書を用いた論文データベース中の所属機 関同定㻌 㻺㻵㻿㼀㻱㻼 では、機関名辞書と論文データベースをリン クさせることによって、我が国の機関の研究活動データ の取得と分析を行っている。その際重要なのは、論文 データベース中の著者所属機関データと機関名辞書 中の機関(代表機関または下部組織)との対応付け(機 関同定)である。㻌 ここでは、㼃㼑㼎㻌 㼛㼒㻌 㻿㼏㼕㼑㼚㼏㼑㻌 㻯㼛㼞㼑㻌 㻯㼛㼘㼘㼑㼏㼠㼕㼛㼚㻌 㻔㼃㼛㻿㻯㻯㻕 データベースを用いた機関同定について、同定を難し くする問題点と、それぞれの問題点に対処するための 機関名辞書や同定アルゴリズムの工夫について述べ る。㻌 㻌 㻠㻚㻝㻌 機関名の表記ゆれ㻌 【問題点】㻌 論文データベースの所属機関には、同じ機関の名称 が様々の形で表記されている(これは、もとの論文にお ける著者所属機関の表記が多様であることの反映であ る)。そのパターンは次のように大別される:㻔㼍㻕㻌 正式名 称以外の通称や略称による表記、㻔㼎㻕㻌 機関の旧名の表 記、㻔㼏㻕㻌 単語の省略、脱落、順序の入れ替え、㻔㼐㻕㻌 単語 の略記、㻔㼑㻕㻌 冠詞、前置詞、接続詞、記号(ハイフン等) の省略や書き換え、㻔㼒㻕㻌 スペルの違い(単数形と複数形 のゆれ、ヘボン式と訓令式のゆれ、単語間のハイフン挿

(5)

入の有無、単純なスペルミスなど)㻌 【対策】㻌 まず、機関名辞書の補助情報(㻞㻚㻠 参照)の充実があ る。この対象は主に上記の㻔㼍㻕~㻔㼏㻕であるが㻔㼒㻕にも一部 対応している。一方、㻔㼐㻕~㻔㼒㻕に対してはアルゴリズムで 対応している(略記辞書の適用、規格化処理、曖昧マッ チングなど)。㻌 㻌 㻠㻚㻞㻌 代表機関名と下部組織名のサブフィールド配置の 不規則性㻌 【問題点】㻌 㼃㼛㻿㻯㻯 では、所属機関フィールド(機関名の他、所 在地、郵便番号、国の情報を含む)から代表機関と下 部組織の部分を取り出し、それぞれを 㻻㻾㻳、㻿㼁㻮㻻㻾㻳 というサブフィールドに収録している。これは同定を行う 上で便利であるが、㻔㼍㻕㻌㻻㻾㻳 に代表機関と下部組織ある いはキャンパス名が結合(例:㼁㼚㼕㼢㻌 㼀㼛㼗㼥㼛㻌 㻴㼛㼟㼜、㼁㼚㼕㼢㻌 㼀㼛㼗㼥㼛㻌㻴㼛㼚㼓㼛);㻔㼎㻕㻌㻻㻾㻳 と 㻿㼁㻮㻻㻾㻳 に代表機関名が分 離(例:㻌 㻰㼛㼗㼗㼥㼛㻌㼁㼚㼕㼢㻌㻿㼏㼔㻌㻹㼑㼐 の 㻰㼛㼗㼗㼥㼛㻌㼁㼚㼕㼢 が 㻻㻾㻳 に、㻿㼏㼔㻌㻹㼑㼐 が 㻿㼁㻮㻻㻾㻳 に泣き別れ);㻔㼏㻕㻌㻻㻾㻳 に下部 組織名が、㻿㼁㻮㻻㻾㻳 に代表機関名が入る、など、この 原則から外れた場合がある。㻌 【対策】㻌 同定処理の中核部分である最長マッチング処理では、 所属機関データ表記単語列を機関名辞書内表記単語 列と比較し、後者を完全に内包する単語列が前者の中 に見つかれば、そのうち最も長い単語列のデータに相 当する機関名辞書の機関に同定するが、この処理はま ず 㻻㻾㻳 サ ブ フ ィ ー ル ド に 対 し て 行 い 、 そ の 後 、 㻿㼁㻮㻻㻾㻳 と 㻻㻾㻳 を合体した単語列㻔㻿㼁㻮㻻㻾㻳㻗㻻㻾㻳㻕に 対して行う。㻿㼁㻮㻻㻾㻳㻗㻻㻾㻳 単語列とのマッチングにより、 上記のように 㻻㻾㻳 と 㻿㼁㻮㻻㻾㻳 へのデータ配置が原則 から外れている場合にもある程度対処することができ る。㻌 㻌 㻠㻚㻟㻌 一つの所属機関フィールドに複数の機関が存在㻌 【問題点】㻌 論文の著者が複数の機関に所属している場合、通常 は別々の所属機関フィールドに収録されるが、論文に 著者が複数の機関(または組織)を合体して記述してい ると、データベースでもそれらが分離されず、一つの機 関データに 㻞 機関が存在してしまう場合がある。次の例 では国立遺伝学研究所と総合研究大学院大学が合体 表記されている。㻌 “ 㻰㼕㼢㻌 㻹㼍㼙㼙㼍㼘㼕㼍㼚㻌 㻰㼑㼢㻘㻌 㻺㼍㼠㼘㻌 㻵㼚㼟㼠㻌 㻳㼑㼚㼑㼠㼕㼏㼟㻘㻌 㻰㼑㼜㼠㻌 Genetics, SOKENDAI”㻌 この著者はその両方の機関に所属していると考えら れるので、両方の機関を同定できることが必要である。㻌 【対策】㻌 最長マッチングでは、㻿㼁㻮㻻㻾㻳㻗㻻㻾㻳 単語列で一つ の機関がマッチした後、単語列の残りの部分が別の機 関にマッチしないかサーチし、全単語列をサーチするま でこの手続きを繰り返す。㻌 㻌 㻠㻚㻠㻌 同一の英語機関名を持つ機関㻌 【問題点】㻌 統合や改組により日本語機関名は変更したのに英語 名は旧機関と継承機関で同じという例がよく見られる(た とえば東京都立大学と首都大学東京はどちらも 㼀㼛㼗㼥㼛㻌 㻹㼑㼠㼞㼛㼜㼛㼘㼕㼠㼍㼚㻌 㼁㼚㼕㼢㼑㼞㼟㼕㼠㼥)。このような場合、新旧どちら の機関に対応するか判断しづらい。㻌 無関係の機関が同一の英語名を持つ例は会社に多 少見られるが、大学や公的機関ではほとんどない。㻌 【対策】㻌 同名の機関が存在して両者の間に継承関係がある 場合は、機関名辞書の移行年と論文の発行年を比較し、 発行年が移行年以前なら旧機関に、そうでなければ新 機関に同定する(移行年データがない場合は新機関に 同定する)。但し、統合により代表機関が継承機関の下 部組織になる等いろいろな場合があるので、パターンに 応じてきめ細かく同定機関を選別できるようにした。㻌 関係のない機関の英語名がたまたま同じ場合は、郵 便番号比較により識別するが、そのデータがなく決めき れない場合は同定不能とする。㻌 㻌 㻠㻚㻡㻌 英語名が非常に似ている機関㻌 【問題点】㻌 機関名が機関表記によく使われる単語のみから成る 場合、類似した名前の機関が存在して誤同定が起こり や す い 。 た と え ば 、 分 子 科 学 研 究 所 㻔㻵㼚㼟㼠㼕㼠㼡㼠㼑㻌 㼒㼛㼞㻌 㻹㼛㼘㼑㼏㼡㼘㼍㼞㻌 㻿㼏㼕㼑㼚㼏㼑㻕にごく類似した名称の付属研究所を 持つ機関は多数存在する。㻌 似通った名称の大学の間でデータベース中の表記 が誤っていたり曖昧であったりすると、違う大学に同定さ れてしまう。㻠㻚㻞 に示した 㻰㼛㼗㼗㼥㼛㻌 㼁㼚㼕㼢㻌 㻿㼏㼔㻌 㻹㼑㼐 はその 例で、獨協医科大学でなく獨協大学に誤同定される可 能性がある。㻌 【対策】㻌 ありふれた単語からなる機関の誤同定防止のために は、類似の名称の機関(下部組織を含む)に使われるい ろいろな表記を機関名辞書に補助情報として収録す る。㻌 また、似通った名称の大学については次のような特 別措置を適用している。それぞれの大学に正しく同定さ

(6)

れた機関データ(その判定には郵便番号を利用)に含 まれる単語列から、その大学との共起性が高いものを抽 出した辞書を作成し、この辞書を同定に活用する。たと えば静岡大学と静岡県立大学の場合、㻎㻲㼍㼏㻌 㻿㼏㼕㻌 㻎や 㻎㻲㼍㼏㻌㻭㼓㼞㻌㻎は前者、㻎㻿㼏㼔㻌㻼㼔㼍㼞㼙㻌㻿㼏㼕㻌㻎や㻎㻿㼏㼔㻌㻲㼛㼛㼐㻌㻺㼡㼠㼞㻌 㻿㼏㼕㻌㻎は後者に関係づけられる。㻌 㻌 㻠㻚㻢㻌 大学の第 㻞 階層下部組織同定における問題㻌 【問題点】㻌 㻟㻞 大学の第 㻞 階層下部組織の同定においても、㻠㻚㻝 で述べた表記ゆれの問題がある(むしろ更に著しい)が、 それ以外に第 㻞 階層下部組織同定を難しくする独自の 問題がある。それは、大学直下の第 㻞 階層下部組織を 省略してその下の組織が記載されることがしばしばある ことである。たとえば、“㻳㼞㼍㼐㼡㼍㼠㼑㻌 㻿㼏㼔㼛㼛㼘㻌 㼛㼒㻌 㻿㼏㼕㼑㼚㼏㼑㻘㻌 㼄㻌 㼁㼚㼕㼢㼑㼞㼟㼕㼠㼥 ” ではなく“ 㻰㼑㼜㼍㼞㼠㼙㼑㼚㼠㻌 㼛㼒㻌 㻮㼕㼛㼏㼔㼑㼙㼕㼟㼠㼞㼥㻘㻌 㼄㻌 㼁㼚㼕㼢㼑㼞㼟㼕㼠㼥”のような所属表記がなされる。㻌 【対策】㻌 上記のような場合に対する部局同定率の向上のため に、以下の改善策を実施した㻞。㻌 㻔㻝㻕㻌 第 㻞 階層下部組織統計辞書の開発㻌 正しい第 㻞 階層下部組織同定がなされた機関データ (第 㻞 階層下部組織が記載されている)から、大学別に 出現頻度の高い単語列を抽出し、これらの単語列に対 して、第 㻞 階層下部組織別の共起率(大学全体の出現 頻度のうちその第 㻞 階層下部組織との共起の割合)を 求める。出現頻度が高く、かつある特定の第 㻞 階層下部 組織に共起が集中している単語列を、その第 㻞 階層下 部組織に関係づけたものが第 㻞 階層下部組織統計辞 書である。㻌 こうして作成した第 㻞 階層下部組織統計辞書を、最長 マッチングで 㻟㻞 大学に同定されたがその第 㻞 階層下部 組織同定はできなかったデータ(機関名辞書に含まれ る第 㻞 階層下部組織名とはマッチしなかったデータ)に 適用する。たとえば、東京大学に同定されたデータに 㻎㻯㼠㼞㻌 㻴㼡㼙㼍㼚㻌 㻳㼑㼚㼛㼙㼑㻎や㻎㻹㼛㼘㻌 㻹㼑㼐㻌 㻸㼍㼎㻎が含まれれば 医科学研究所、㻎㻰㼑㼜㼠㻌 㻻㼜㼔㼠㼔㼍㼘㼙㼛㼘㻎や㻎㻰㼑㼜㼠㻌 㻿㼡㼞㼓㻎が含 まれれば医学系研究科である確率が高いとして、それ らの第 㻞 階層下部組織に同定される。㻌 㻔㻞㻕㻌 補助情報の対象拡張㻌 第 㻞 階層下部組織統計辞書の対象となった第 㻞 階層 下部組織表記のうち、特定の第 㻞 階層下部組織を示す ことが間違いないと人手で判断できる表記は、機関名辞 㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌㻌 㻞これらの改善策を実施しても、東京医科歯科大学については、第 㻞 階層下部 組織同定が困難である。したがって、現状で、第 㻞 階層下部組織についての分 析が可能なのは、㻟㻝 大学となっている。㻌 書の補助情報に加えた。たとえば東京農工大学の場合、 㻎㻰㼑㼜㼠㻌 㻭㼚㼕㼙㻌 㻸㼕㼒㼑㻌 㻿㼏㼕㻎 は 農 学 研 究 院 㻔㻵㼚㼟㼠㼕㼠㼡㼠㼑㻌 㼛㼒㻌 㻭㼓㼞㼕㼏㼡㼘㼠㼡㼞㼑㻕そのものを示す名称ではないが、同大学に 同定された機関データにこの表記があれば、農学研究 院に同定して間違いはない。㻌 㻌 5.おわりに㻌 機関名辞書の今後の重要課題として、その継続的維 持がある。機関やその下部組織は常に変遷しており、そ の情報を確実にとらえてアーカイブ化するためには、不 断の状況把握・情報更新が必要である。セクターごとに その効率的方法を定め、そのための体制と予算措置を 継続的に講じられるよう検討を進めたい。㻌 もう一つの重要課題として大学部局情報の拡張があ る。現在部局情報の網羅的収録の対象としている 㻟㻞 大 学は、㻝㻥㻥㻢~㻞㻜㻝㻜 年の期間の論文数を基準として選定 しているが、その実態は年とともに変化するので適宜見 直しが必要である。本来は、ある程度の研究規模を持 つ総合大学をすべて対象とするのが望ましい。しかし、 現在の 㻟㻞 大学だけでも、毎年各大学の第 㻞 階層下部 組織の変遷を調査することはかなりの負担であり、その 作業を軽減するための方法を今後検討したい。㻌 㻌 謝辞㻌 ここで述べたデータ整備事業は、指定した作業を請 け負った株式会社 㻾㻺㻭㼕 の協力の下に行われた。㻌 㻌 参考文献 㻝㻕 伊神正貫,小野寺夏生,富澤宏之㻘㻌 「大学・公的機関における研 究開発に関するデータの整備と公開-㻿㼏㼕㻾㻱㼄 データ・情報基盤 構築の成果の紹介-」㻘㻌 研究・技術計画学会,第 㻞㻤 回年次学術 大会,㻞㻜㻝㻟 年 㻝㻝 月 㻞 日,(年次学術大会講演要旨集,㼜㼜㻚㻌 㻟㻠㻠㻙㻟㻠㻣).㻌 㻞㻕 “データ・情報基盤-政策研究の高度化とエビデンスベースの政 策 形 成 の た め の ツ ー ル . ” 科 学 技 術 ・ 学 術 政 策 研 究 所 . 㼔㼠㼠㼜㻦㻛㻛㼣㼣㼣㻚㼚㼕㼟㼠㼑㼜㻚㼓㼛㻚㼖㼜㻛㼞㼑㼟㼑㼍㼞㼏㼔㻛㼟㼏㼕㼟㼕㼜㻛㼐㼍㼠㼍㻙㼍㼚㼐㻙㻌 㼕㼚㼒㼛㼞㼙㼍㼠㼕㼛㼚㻙㼕㼚㼒㼞㼍㼟㼠㼞㼡㼏㼠㼡㼞㼑㻚㻌 㻟㻕 全国試験研究機関名鑑㻌 㻞㻜㻜㻤㻙㻞㻜㻜㻥.文部科学省科学技術・学 術政策局監修,丸善,㻞㻜㻜㻤㻚㻌 㻌

表 㻝㻌 機関名辞書㻔㻞㻜㻝㻡 年 㻡 月バージョン㻕に収録されている機関数㻌 セクター㻌 現存機関㻌 非現存機関㻌 代表機関㻌 下部組織㻌 小計㻌 代表機関㻌 下部組織㻌 小計㻌 国立大学㻌 㻤㻢㻌 㻝㻞㻢㻤㻌 㻝㻟㻡㻠㻌 㻝㻡㻌 㻝㻞㻞㻌 㻝㻟㻣㻌 国立短大㻌 㻌 㻌 㻌 㻞㻢㻌 㻌 㻞㻢㻌 国立高専㻌 㻡㻝㻌 㻌 㻡㻝㻌 㻤㻌 㻌 㻤㻌 公立大学㻌 㻤㻡㻌 㻢㻜㻌 㻝㻠㻡㻌 㻝㻢㻌 㻝㻌 㻝㻣㻌 公立短大㻌 㻝㻣㻌 㻌 㻝㻣㻌 㻠㻡㻌 㻌 㻠㻡㻌 公立高専㻌 㻟㻌 㻌 㻟㻌 㻠㻌 㻌 㻠㻌 大学共同利

参照

関連したドキュメント

䞉ᮏయ᪂タᕤ஦䛆ከ┠ⓗά⏝᪋タᕤ஦䚸ᒇእ௜ᖏᕤ஦䠄໭ഃ㐨㊰ྵ䜐䠅䚸᧔ཤᕤ஦➼ྵ䜐䛇

※ 米政府支援機関(GSE): 「Government Sponsored Enterprise」の略で、政府支援機関などと訳され る。ファニーメイ(連邦住宅抵当公社)は

心臓核医学に心機能に関する標準はすべての機能検査の基礎となる重要な観

参考資料ー経済関係機関一覧(⑤各項目に関する機関,組織,企業(2/7)) ⑤各項目に関する機関,組織,企業 組織名 概要・関係項目 URL

分野 特許関連 商標関連 意匠関連 その他知財関連 エンフォースメント 政府関連 出典 サイト BBC ※公的機関による発表 YES NO リンク

8) 7)で求めた1人当たりの情報関連機器リース・レンタル料に、「平成7年産業連関表」の産業別常

第1条

機器表に以下の追加必要事項を記載している。 ・性能値(機器効率) ・試験方法等に関する規格 ・型番 ・製造者名