• 検索結果がありません。

可変長サンプルと固定長サンプルの相互関係

第 5 章 固定長サンプルの抽出 71

5.3 可変長サンプルと固定長サンプルの相互関係

行中(インライン)にアスキーアートが出現した場合,そのアスキーアートを構成する文字 の種類によってカウント対象とするか否かを判断する。例えば,「ありがと(^^)」という例 の「(^^)」は記号のみであるためカウント対象には含めず,全体を4文字としてカウントす る。一方,「ゴメン m(_ _)m」の場合は「m」をカウント対象文字として数え,全体を 5文字としてカウントする。

なお,ブロック単位のアスキーアートはフィギュアを構成するものと見なし,丸ごとカウン ト対象外とする。

76 第5章 固定長サンプルの抽出

図5.1: 可変長サンプルと固定長サンプルの相互関係のパタン

雑誌・新聞における

サンプリングの原理と運用

6 雑誌におけるサンプリング

本章の概要: 第II部では,書籍を対象として,書き言葉の構造をどのように把握するか,そ の中からどの部分をサンプリングの対象とするか,という点について述べてきた。書き言葉の 構造を捉えるための見方は,雑誌からサンプルを取得する場合においても有効である。しかし ながら,雑誌というメディアが持つ特有の問題により,書籍の場合とは異なる問題点が生じる ことがある。ある記事が「広告」であるかをどのように判別するか,ある紙面の理想範囲をど のように定めるか,といった問題である。

そこで本章では,第II部で示したサンプリングの原理を踏まえた上で,雑誌のサンプリン グにおいて問題となる点とその判断基準について示すことにする。

6.1 雑誌の特徴と紙面構成

ここでは雑誌という定期刊行物が持つ一般的な特徴として,以下の3点を挙げておく。

書籍に比べて速報性が高いこと

多種多様な記事1が写真やイラストなどとともに複雑に構成されていること

「広告」のページが多く含まれること

雑誌の大半は「週刊」や「月刊」のように短い刊行周期を持っており,新聞ほどではないも のの,速報性の高い出版メディアであると言える。かつその中には,論説記事,エッセイ,料 理のレシピ,映画の情報,洋服の値段,広告など,実に多くの種類の記事が(場合によっては 所狭しと)詰め込まれていることが多い。1人の著者が時間をかけてじっくりと1冊の雑誌を 編集する,ということはまずない。むしろ,多人数の執筆者による小さな記事が集まって1冊 の雑誌が構成されていると言ってよい。

このような雑誌の特性を踏まえた上で,雑誌の印刷紙面から文章をサンプリングしようとす る場合,いくつか注意を要する点がある。以下では順に,雑誌に特有の問題とそれに対する判 断基準を挙げていく。

1ここでは便宜的に,著者の別や目次により他の部分と区別される一定範囲を「記事」とする。

80 第6章 雑誌におけるサンプリング