• 検索結果がありません。

9ECF gEDO 9ED4 9EDC 9EDE 9EDD 9EEO 9EE5 9EE8 9EEF gEF4 9EF6

120

  0   5   0   1   0   0   0   1   4   1   0   0   0   0   3   0

 22

  7

 11 366

  2   0   2   0   4   1   1   3

419

  2   0   3

 21  62

  3

 14

  3   0   4

 16 1156

  3   3   0

1260  16  41

  0

繊齢胆竈驚鼓馨厳馳軒齊歯齪齢齪齪齢齪醤酷齪醒離鰐寵亀禽尭槙遙珪凛煕

152一

EA82 7362 83−66  9EF7 EA83 7363 83−67  9EFg EA84 7364 83−68  9EFB EA85 7365 83−69 9EFC EA86 7366 83−70 9EFD EA87 7367 83−71  9FO7 EA88 7368 83−72  9FO8 EA89 7369 83−73  76B7 EA8A 736A 83−74  9F15 EA8B 736B 83−75  9F21 EA8C 736C 83−76 9F2 C EA8D 736D 83−77  9F3E EA8E 736E 83−78 9F4A EA8F 736F 83−79  9F52 EA90 7370 83−80  9F54 EA91 7371 83−81  9F63 EA92 7372 83−82  9F5F EA93 7373 83−83  9F60 EA94 7374 83−84  9F61 EA95 7375 83−85  9F66 EA96 7376 83−86  9F67 EA97 7377 83−87 9F6 C EA98 7378 83−88  9F6A EA99 7379 83−89  9F77 EAgA 737A 83−90  9F72 EA9B 737B 83−91  9F76 EA9C 737C 83−92  9F95 EA9D 737D 83−93 9FgC EA9E 737E 83−94  9FAO EAgF 7421 84−01  582F EAAO 7422 84−02  69C7 EAA1 7423 84−03  9059 EAA2 7424 84−04  7464 EAA3 7425 84−05  51DC EAA4 7426 84−06  7199

 0  0  1  1  4  6  6 127

  1

 0  0  5 100 125  0  1  2  0 128  2  0  2 10 10  1  0 10 78  0 12  3 261 15 17  5

6 おわりに

 本報告は、『太陽』1901のテキストデータをJISによって作成する場合に必要となった、漢字 の同定規準について、述べてきた。規準づくりには、テキスト側における漢字調査と、文字コ ード側における規格の理解とを、あいまいさを解消するレベルにまで行って、相互の対応づ けをはかる必要があった。

 テキスト側の漢字調査には、人力の範囲内で万全を期したが、読み誤りや見落としは残さ れているに違いない。文字コード側の規格に関しても、JIS規格票については理解に努めた が、JIS以外の文字コードの検討については、ほとんど手つかずの状態である。さらに、対応 づけのために、包摂規準とその補足規準の明示、準包摂漢字の指摘や、参照字の統合の問 題提起など、いくつかの規準もしくは規準づくりのための見通しを提示したが、その全体を整 合させるところまでには至らなかった。その意味では、漢字の同定規準は作成途上の段階 で、今後継続して調査を行う必要がある。このように、未解決の問題は多いものの、あるテキ ストデータをある文字コードを用いて作成する場合に問題となる、主なことがらについては、

だいたい扱うことができたのではないかと考える。

 『太陽』1901は、国立国語研究所国語辞典編集室が計画しているコーパス構築の一部を なすものである。『太陽』の1901年以外の年次、他の雑誌、雑誌以外の資料と、明治以後のさ まざまな資料のテキストデータ化が、順次予定されている。われわれ以外によっても、テキスト データ作成は、さまざまな文献についてますます盛んに進められていくものと思われる。これ からのテキストデータ作成は、より大規模かつ高品質のものが、目指されていくであろう。一 方、文字コードも、より大規模かつ透明性の高いものが一般化していくであろう。本報告が、

将来の本格的なテキストデータ作成に対して、方法論的な議論のきっかけになることができ れば幸いである。

参考文献

池田証寿1998「新JIS漢字コード(第三・第四水準)開発の現状」訓点語学会第78回研究発表会発 表資料

小宮山博史1998「タイプフェイス・デザイン 本木昌造追悼記事から考える」『ユリイカ』30−6青土 社

符号化文字集合調査研究委員会第2作業分科会1998「新IIS漢字策定の進捗状況」http://www.t

iu.acjp/

芝野耕司1997『JIS漢字字典』日本規格協会

豊島正之1992「『JISにない字』をめぐって」『しにか』3−2大修館書店 豊島正之1998「符号化漢字集合の策定」国文学研究資料館

永村真1996 「日本史史料漢字文字列のデータ表現」 『人文科学と情報処理』10勉誠社 日本規格協会1997『日本工業規格 7ビット及び8ビットの2バイト情報交換用符号化漢字集合(JIS XO208:1997)』 日本規格協会

府川充男1998「当今『漢字問題』」卑見」『ユリイカ』30−6青土社

153一

平凡社1998『電脳文化と漢字のゆくえ 岐路に立つ日本語』平凡社 星野聰1992「異体字をどう考え、どう処理するか」『しにか』3−2大修館書店 家辺勝文1998『デジタルテキストの技法』ひつじ書房

横山詔一・笹原宏之・野崎浩成・エリクーロング1998『新聞電子メディアの漢字 朝日新聞CD−RO Mによる漢字頻度表』国立国語研究所プロジェクト選書1三省堂

飯島満・大塚みさ1998「近代活字文献の電子テキスト化における字形の整理 JIS包摂規準の活用 と提案」語彙辞書研究会第14回研究発表会

木村睦子・田中牧郎・飯島満1997「『太陽』コーパスの作成と活用」新プロ「日本語」研究班4梶原チ

ム研究報告書

田中牧郎1998「『太陽』コーパスの作成」国立国語研究所創立50周年記念研究発表会発表資料

木村睦子(国立国語研究所国語辞典編集室長)

田中牧郎(国立国語研究所国語辞典編集室研究員)

飯島 満(国立国語研究所国語辞典編集室非常勤研究員)

笹原宏之(国立国語研究所言語体系研究部第三研究室研究員)

154一

 「i  一下 ny

関連したドキュメント