2握1アクAにぎ☆
1渥あつい ☆
2旭Aあさひ1キョク☆
1葦あし ☆ 1芦あし ☆
単位切りテーブル(漢字仮名混じう用)(認GMEM.TBL,10321バイト)
3および 3おける 4こうした 2して 1た
3A 2ERIPI
2C IE91P−i−
IEgIR
lP十
品詞と活用の部分は,コードで袈わしていて,その意味は次のようになっ ている。
一11護一
品謂コード 1 名詞
A 接続詞 B 感動詞 C 副詞 D 連体詞
E動詞 M形容詞
P 助動詞 Q 助動詞または助詞 R 助詞 Y 記号 X 数字
活燭コード
8 未然形 9 連用形 # 未然形または遽糊形 H 終止形 1 連体形 ÷ 終止形または連体形 Q 仮定形 R 命令形
助詞,助動詞接続テーブル(POSTBL1.TBL,1357)
の斜R1 麟と#から# で詫へ#より#まで#だけさばかり書こそ#など彰ぐらい薯
1 +1 /1 @@
を齢R1 麟と尊から#まで呑の#だけ#1まかり#こそ#さえ#すら#のみ#,など#
ぐらい#1/1㊥曾
に酬臥 麟と#の葬だけ#ばかり#のみ#1など萎ぐらい#.49萎1+1/1@@
は蹴3 饒麟に斐か艦で#.よ聾まで#の#1だけblばか聾こ鴛な礁ぐら
し、季 9‡≠+11/1@@
が§WR13 麟の#と#から#まで#も葬だけ鴬ばかり#こそ#さえ葬のみ#など#ぐ らい琴i・;11/1麗
と@IYR13麟の#だけ渉ばかり#.のみ#な凄ぐらい#田岨1/i縄 で繍R13 麟ない蓼 g1/1@@
た瞳WP 1÷ § E9 9/E9§@
品調接続テーブル(POSTBL2.TBL,297ノくイト)
一115一
このデータのフォーマットは次の通りである。
の@WRI @#と#から#で#へ#よ眺まで#だけ#ばかり#こそ#など#
ぐらい# 1 +1/1@@
1.語 2.品詞
3.この語の直前に用いることのできる助詞・助動詞 4.この語の直前に用いることのできる品詞と話用形
5.もし,直前の語が3,4と〜致しなければ強鱗的に適用する品詞・漬用 形
助詞,助動詞接続チェック用テーブル(PRTSTR.TBL,63911・ イ})
らしい そうだう
よう
る
ようだ ようです れれ なけれ べき
1
1
1
2211
1
11 2
942
ら肖り乙III
ll 121
111 221
! 121
2
2 1 21 1 2
一II6一
縦に並んだ付属語と横に並んだ付属語(図では明示していない)との交差 する箇所に1または2があればその接続が存在することを示す。2は頻度が 多いことを示しているがプログラムではこの情報を使用していない。
連用形変換テーブル(REN. YOU.TBL,103797,3660)
五段あい 五段あい 五段あいつい 五段あいつぎ 五段あえい 五段あえぎ 五段あおい 五段あおぎ 五段あおっ 五段あおのい
うくぐぐぐぐぐぐるく
五段あおのき五段あおみ 五段あおむい 五段あおむき 五段あおり 五段あおん 上一あかさび 五段あかし 五段あかしくらし 五段あからみ
くむくくるむるすすむ
その語形があれば,最後の十手を右端の一字に変える。
8.今後の課題
機械の発達によりシステムは変化すると考えられる。しかし,欝語処理部 分は変らない。したがって,言語処理部分を独立させ,新しい機械システム に組み込む努力と注意が必要である。また,完全な機械処理が望めないとす ると,いかに効率的な修正システムを作るかが重要となる。一般に機械処理 の誤りの箇所は特定できない。しかし,経験的に誤りの起こりやすい箇所は 予想できる。そのような箇所を抽出し,注意して検査するためのシステム,
作業を繰り返しやすくするためのファイル管理システムなどが重要となろう。
今後ますます高速大容量の機械が出現するに違いない。しかし,上に述べ たようにわれわれの研究は,人間の検査なし には考えられないのである。
ヒューマンインターフェースに優れた機械の出現を望みたい。
一1エ7〜
本プmグラムシステムおよび辞書をフロッピーでご入用の方は筆者まで文 書でご連絡ください。
謝 辞
学習院大学の田中章夫教授は困語研究所に在職されていた時に第4研究部 第!資料研究室長として,この研究の計画を立案され,かつ,漢字解読のプ
ロトタイプを作成された。江川清情報資料研究部長は,第4研究部第1資料 研究室におられた時に単位分罰のプmトタイプを作成された。いずれも,本
プログラムにそれらを利用することを許された。
また,一貫処理プpaグラムの評価については言語計量研究部第1研究室
(当時)の石井正彦研究員と小沼悦研究補助員の,パソコンへの移植につい てはアルバイタ山田雅一氏の協力を得た。
以上の方々の他.香川大学土屋信一教授,上越教育大学鶴岡昭失助教授,
国立鼠語研究藤出崎誠研究員,筑波大学の荻野綱男講師の貴璽な意見を得る ことができた。それぞれ記して,感謝の意を表する。
参考文献
1.荒木 啓介・板由 和彦縦CSTの実周的漢字一カナ変換システムK−KACS について」(情報処理20−!0,1979)
2.石井 久雄「「一貫処理システム」KAI90KUプmグラムの『雑誌用語の変 遷』語彙表への心逸」(CL通信第3号,1989.3,国立圏語研究所言語 計 量研究部)
3.石井 正彦「自動単位分割の精度と問題点1(CL通信第3号,1986,4,
IO, 国立国言落石}F究潭斥欝言吾言t量研究部)
4。岩波書店編「電子広辞苑」(岩波書店,1988)
5.江川 清膜字かな混り文の「自動単位分割」に関する一研究」(計量屡
言護学負943/44巻, !968)
6.江川 清「単位分割自動化のシステムについて」(計量国語学第5!巻,
1969)
一l18一
7.小沼 悦「一貫処理プmグラムの評価実験(3)一精度,人手作業と の比較において一」(CL通信第3号,1986.4,国立国語研究所雷語計量研 究部)
8.国語学会・国立国語研究所編「臼本語研究文献冒録・雑誌編」〔フvッ
ピー版] (秀英出版, 1989)
9.国立国語研究所「電子計算機による新聞の語彙調査」(蟹立国語研究断報
管37, 秀英織上反, 1970)
10.国立国語研究所「高校教科書の語彙調査」(園立国語研究所報告76,秀英
と6片反, 1983)
11.国立国語研究所「中学校教科書の語彙調査」(国立国語研究所四二87,秀 英出版,1986)
12。斎藤 秀紀「漢字かな混り文の文字列」(LDP月報別冊8,!971,2,圏立 国語研究所)
13.坂本 義行「文節単位の自動分割法一字種と平仮名連糸による一」(計量 国語学11巻6号,/978,9)
14.真田 治子「文体の自動変換一ダ体からデス・マス体へ」(計量圏語学 16巻7号, 1988, 12)
!5、三省堂編膜範六法CD−ROM版」(三省堂,1989)
16.団中 章夫「漢字かなまじり文を全文カナ書き・ローマ字書きに変換す るシステムについてj(電子計算機による国語研究E,1969,秀英出版)
17.藤崎博也・亀田弘之「自動単位切りによる新聞記事の語彙調査」(昭和 60年度文部省科学研究費特定研究(1)「構報化社会における雷語の標準化」
報告書,1986)
18.宮馬達夫・中野洋・鈴木泰・石井久雄fフロッピー版吉典対照語い表お よび使用法」(笠間書院,1989)
19.バイブルズ編「CD−1{IASK(朝艮新聞前文データベース)」(CD遭側電子出 版サービス「バイブルズj,1989)
20.中野 洋f品詞認定の自動化」(電子計算機による国諾研究lll.1971,秀 一H9一
英出版)
21.一一縢引作成プログラムライブラリ」(電子計算機による国語研究嘘,
1976, 秀英引戸)
22.一時引作成プmグラムライブラリ」(電子計算機による国語研究嘱,
1977, 秀英と昌版)
23.一一「言語研究における一貫処理の研究」(電子計算機による国語研究 X,1978,秀英幽版)
24. NAKANO Hiroshi, TSUTIYA ShiR itL TURUOKA Aklo rAN