タグデータの校正のためのデータ間の共起関係に基づく関連タグの抽出に関する研究
2
0
0
全文
(2) 情報処理学会第 82 回全国大会. 4. 実験 4.1. 概要 2.2 節で述べた道路維持管理業務データ集合に 対して提案手法を適用し、専門英語のカタカナ 表記に共起性の高い日本語を関連語の候補とし て道路地盤コンサルタントに確認してもらった。 管理業務データは、点検等の業務と施工を伴 う工事に大別され、合わせて 212 件からなる。 各管理業務は、(名称、概要、(業務概要 | 工事 内容))の3項目からなる。. 図 1. 処理の流れ(破線部は未実装). 4.2. 結果 8 つのカタカナ表記のうち、専門家によって関 連性が認められた 5 つの共起性の強かった語を 表1にまとめた。有効な関連語が得られなかっ た 3 つは、カットオフ、ジオテキスタイル、ジ オロックウォールであった。得られた高共起性 語はカタカナ表記と共起性が高いと同時に他に は見られない珍しい語であった。この意味では、 DB の大きさが不十分であるとも言える。. 効果に加え、共起性の強い単語同士(あるいは 類似した文脈の管理業務)が似たベクトルで表 現されるようになることを期待している。 Spectral Clustering[3]では、単語のベクト ルの似た者同士が連続するように単語の並べ替 えを行う。ここで得られる2種類の並べ替え結 表 1 関連が抽出できた共起性の強い語 果を横軸と縦軸にして単語の関連度を距離で表 カタカナ表記 高共起性語 関連性 したものが単語マップである。 ボックスカルバート 水桝 関連大 以上までは自動化する。最終的な表現のゆら グラウチング 充填 やや同義 ぎと同義語の発見は、単語マップにより関連性 の強い単語群を専門家により分析して検出する。 パッカー 充填 関連大 そのために、注目単語の周辺だけを拡大するツ アスカーブ 側道 関連大 ールと単一の項目に含まれる単語のみを表示す プレテン ひび 関連大 るツールを作成した。図 2 に全体の単語マップ と拡大マップの例を示す。 5. おわりに 登録済みデータ間の共起関係に基づき関連デ ータを抽出し、データの不揃いを改善する手法 について検討し、道路維持管理業務データに適 用した。英単語と日本語の同義性に基づく関連 語を抽出でき検索効率の向上が見込まれた。今 後は、より大きな DB の構築と検証が必要である。. (a)全体の単語マップ. 図 2. (b)拡大マップ 単語マップの例. [参考文献] [1]矢部,他、道路法面点検データの公開に向け たブロックチェーンを用いたデータの信憑性担 保の研究、情報処理学会第 80 回全国大会 [2] S. Deerwester, etc, Indexing by Latent Semantic Analysis, Journal of the American Society for Information Science, 41(6):391407, 1990. [3] S. Guattery, etc, On the performance of spectral graph partitioning methods, Annual ACM-SIAM Symposium on Discrete Algorithms, 1995. 1-364. Copyright 2020 Information Processing Society of Japan. All Rights Reserved..
(3)
図
関連したドキュメント
問についてだが︑この間いに直接に答える前に確認しなけれ
本論文での分析は、叙述関係の Subject であれば、 Predicate に対して分配される ことが可能というものである。そして o
つまり、p 型の語が p 型の語を修飾するという関係になっている。しかし、p 型の語同士の Merge
あれば、その逸脱に対しては N400 が惹起され、 ELAN や P600 は惹起しないと 考えられる。もし、シカの認可処理に統語的処理と意味的処理の両方が関わっ
「海洋の管理」を主たる目的として、海洋に関する人間の活動を律する原則へ転換したと
ためのものであり、単に 2030 年に温室効果ガスの排出量が半分になっているという目標に留
るものの、およそ 1:1 の関係が得られた。冬季には TEOM の値はやや小さくなる傾 向にあった。これは SHARP
である水産動植物の種類の特定によってなされる︒但し︑第五種共同漁業を内容とする共同漁業権については水産動