キーワードによる文章間のつながりを活用したコミュニティ内情報共有
2
0
0
全文
(2) 情報処理学会第68回全国大会. 2.2 Blog エントリ共有システムの実装 Blog エントリ共有システムは、コミュニティ内の Blog 群に対して以下の手順を踏む事で実現される。ま ず、エントリに対して新規作成や修正が行われると、 Blog システムは 2.3 キーワード付加で述べる手法を用 いて、エントリに付加するキーワードを最大五個まで 設定する。そして、投稿されたエントリのキーワード を、各キーワードが設定されたエントリを一覧表示す るページへのリンクと一緒に表示する。さらに、Blog システムが自動生成した RSS 1.0 に、オブジェクトの 分類を可能にする mod taxonomy[1] を利用したエント リのキーワード情報を付加して、更新情報として公開 した。 エントリを一覧表示するページは PukiWiki を利用し て構築した。設定された時間が経過された状態で PukiWiki が閲覧されると、PukiWiki は登録された RSS を パースして前回にパースした時から新規作成や修正が 行われたエントリを探す。さらに、見つかったエント リのキーワード情報を取得し、各キーワードごとに一 覧表示を行うための PukiWiki のページに対してその エントリのタイトルやリンク、投稿者の情報を追加す る。以上によって Blog 同士が同じキーワードでつなが ることが可能になる。 2.3 キーワード付加 Blog エントリに対するキーワードの設定であるが、 エントリの文章から特徴語抽出を行い、特徴キーワー ドとしてエントリに付加することにした。特徴語抽出 を行う文章に対して分かち書きを行い、各単語に対し て式 (1) で求められる tf-idf 値 [2] を計算し、値が大き い単語を特徴語として選択した。 µ tf · idf. =. ni · log. |D| |(di ⊃ ti )|. 3. 試用対象 金沢工業大学知的創造システ ム専攻で行われ た. 「WEB アプリケーション開発特論」において、10 名 の受講生が Blog に書き込みを行っていた。全 15 回の 講義において、各受講生が書き込みを行ったエントリ数 は最大が 15 件で、最小が 2 件で、平均が 9.6 件であっ た。また、一エントリあたりの文字数については、最大 が 969 文字、最小が 7 文字、平均が 127 文字であった。 これらに対して、本システムの適用を予定している。. 4. 類似サービス 類似のサービスとして、付加されたキーワードを通. してブックマークや画像を共有するサービス [3][4] が 存在する。これらのサービスと今回のシステムの間に は、共有するコンテンツがインターネット上か特定の コミュニティ上かという違いがある。また、類似のサー ビスはキーワードを人手で付加するのに対し、今回の システムは自動的に付加している。これは、社会人で もある受講生の負担を軽減すると同時に人手による付 加により生じるキーワードのゆれを解決する為に行っ た。キーワードのゆれの問題はコンテンツ量の増加に よっても解決されるが [5]、今回の状況では十分な量が 得られていなかった。. 5. おわりに 今後は、実際に受講生の Blog エントリを対象にシス. テムを適用して、キーワードとエントリのつながりの 様子を分析する予定である。三種類の文章集合による 特徴語抽出の違いを参考にして、今回のシステムに相 応しい特徴語抽出を考案したいと考えている。. ¶ (1). 参考文献 [1] RSS 1.0 Modules: Taxonomy. http://web.resource.org/rss/1.0/modules/taxonomy/.. ni : 抽出を行う文章に単語 ti が登場した回数 |D| : 文章集合 D に含まれる文章の数. [2] Tf-idf. http://en.wikipedia.org/wiki/Tf-idf.. |(di ⊃ ti )| : 文章集合 D に単語 ti が登場した回数 各項の意味は tf の項が文章中によく登場する単語が 重要であり、idf の項は他の文章集合にはあまり登場し ない単語が重要である事を意味している。文章集合 D には、以下の三種類の文章集合を用意し、システム管 理者が変更できるようにした。. • インターネット上の Blog エントリ (100,000 件) • 授業で受講生が記述した Blog エントリ (96 件) • IT 分野の用語辞典の説明文 (8669 項目). 3-8. [3] del.icio.us. http://del.icio.us/. [4] Flickr. http://www.flickr.com/. [5] Adam Mathes. Folksonomies - Cooperative Classification and Communication Through Shared Metadata. http://www.adammathes.com/academic/computermediated-communication/folksonomies.html, Dec 2004..
(3)
関連したドキュメント
文献資料リポジトリとの連携および横断検索の 実現である.複数の機関に分散している多様な
資料 13-3 デジタル時代における 放送の将来像と制度の在り方 に関する取りまとめ ( 案 ) デジタル時代における放送制度の在り方に関する検討会 2022 年 ( 令和 4 年 )7 月 29 日
国民の「知る自由」を保障し、
Instagram 等 Flickr 以外にも多くの画像共有サイトがあるにも 関わらず, Flickr を利用する研究が多いことには, 大きく分けて 2
北区では、外国人人口の増加等を受けて、多文化共生社会の実現に向けた取組 みを体系化した「北区多文化共生指針」
本文書の目的は、 Allbirds の製品におけるカーボンフットプリントの計算方法、前提条件、デー タソース、および今後の改善点の概要を提供し、より詳細な情報を共有することです。
がんを体験した人が、京都で共に息し、意 気を持ち、粋(庶民の生活から生まれた美
• 競願により選定された新免 許人 は、プラチナバンドを有効 活用 することで、低廉な料 金の 実現等国 民へ の利益還元 を行 うことが
(ECシステム提供会社等) 同上 有り PSPが、加盟店のカード情報を 含む決済情報を処理し、アクワ