• 検索結果がありません。

『日本語の語彙・表記』Web資料2:ピボットテーブルを使った集計(182.2KB・)

N/A
N/A
Protected

Academic year: 2021

シェア "『日本語の語彙・表記』Web資料2:ピボットテーブルを使った集計(182.2KB・)"

Copied!
2
0
0

読み込み中.... (全文を見る)

全文

(1)

Web 資料 2

ピボットテーブルを使った集計

この資料では,「中納言」でダウンロードした検索結果ファイルを使って語や語形,表記 の頻度を集計する際の基本的な手順を説明する。 (1)検索結果ファイル(csv ファイル)を開き,メニューから[ファイル]→[名前を 付けて保存]を選択する。[ファイルの種類]を「Excel ブック」に指定し,任意の 名前を付けて保存する。 (2)メニューから[挿入]→[ピボットテーブル]を選択する。 (3)語形の頻度を集計する場合,以下のとおりフィルターと[行][値]を指定する。 行:「語形」をドラッグ&ドロップ。 値:「キー」をドラッグ&ドロップ。 ※1 第 3 章の例題 1 では,新たに付与した媒体という情報を使って,媒体別に頻度を 集計する。この場合,[列]に「媒体」をドラッグ&ドロップする。

(2)

※2 語の頻度を集計する場合は「語彙素」を,表記の頻度を集計する場合は「書字形」 を[行]にドラッグ&ドロップする。 レジスター別に集計する場合は[行]に「レジスター」をドラッグ&ドロップす る。なお,表の見やすさを考えて,[行]と[列]とを入れ替えてもよい。 ※3 [行][列]には,複数の項目をドラッグ&ドロップすることができる。以下は, 語別の表記頻度表(第6 章・例題 1)を作成する際の[行][列]の指定である。 上記のように指定して表を作成した場合,以下の手順で表の体裁を整える(Web 資料1 の「3.語彙表の作成」参照)。 - [ピボットテーブルツール]→[デザイン]から以下の設定をする。 ①[小計]→[小計を表示しない]を選択。 ②[レポートのレイアウト]→[表形式で表示]を選択。 ③[レポートのレイアウト]→[アイテムのラベルを全て繰り返す]を選択。 本書・付録1 で解説したとおり,BCCWJ の短単位解析に用いた形態素解析用辞書 UniDic は,見出しが階層的な構造になっている。この階層的な構造はBCCWJ にも反映している。 検索結果のkwic ファイルを見ると分かるとおり,語形・書字形は,以下のような情報と なっている。 語 形 : 「キー」の読みを表記し,活用語の場合は,それを終止形にしたもの。 書字形 : 「キー」に示された表記のそのままで,活用語の場合は,それを終止形に したもの。活用しない語の場合,「キー」と「書字形」は全く同じ情報。 どのような語形が,又はどのような表記が使われているか調査する場合,活用形の違い まで見る必要はない。そのため,活用する語の語形・書字形は,終止形になっているので ある。

参照

関連したドキュメント

本資料は Linux サーバー OS 向けプログラム「 ESET Server Security for Linux V8.1 」の機能を紹介した資料です。.. ・ESET File Security

○関計画課長

本資料は、宮城県に所在する税関官署で輸出又は輸入された貨物を、品目別・地域(国)別に、数量・金額等を集計して作成したものです。従っ

本資料の貿易額は、宮城県に所在する税関官署の管轄区域に蔵置された輸出入貨物の通関額を集計したものです。したがって、宮城県で生産・消費

本資料は、宮城県に所在する税関官署で輸出又は輸入された貨物を、品目別・地域(国)別に、数量・金額等を集計して作成したものです。従っ

本資料は、宮城県に所在する税関官署で輸出又は輸入された貨物を、品目別・地域(国)別に、数量・金額等を集計して作成したものです。従っ

本資料は、宮城県に所在する税関官署で輸出又は輸入された貨物を、品目別・地域(国)別に、数量・金額等を集計して作成したものです。従っ

本資料の貿易額は、宮城県に所在する税関官署の管轄区域に蔵置された輸出入貨物の通関額を集計したものです。したがって、宮城県で生産・消費