• 検索結果がありません。

日本の情報処理技術の足跡:漢字・日本語処理技術の発展:日本語の入出力と処理

N/A
N/A
Protected

Academic year: 2021

シェア "日本の情報処理技術の足跡:漢字・日本語処理技術の発展:日本語の入出力と処理"

Copied!
6
0
0

読み込み中.... (全文を見る)

全文

(1)連載 :. 足跡. 情報処理技術の の 日本. 漢字・日本語処理技術の発展:. 日本語の入出力と処理 浦城 恒雄 . 東京工科大学メディア学部 [email protected]. ■ 1970 年代:  1970 年代半. 漢字・日本語処理の変遷. 入. 高速漢字. 一部. 民間企業. ,保険業界  今日, 度. 数千種以上. PC. 漢字変換技術. 輪郭. 用. 鍵盤. 入力. 中心. ,一般 47 ∼ 63 字. ,. 度 文字種 国 ,. 頃. 改良 取. 機. 終. 商用機. 電信系. , 径. 大. 主体. 続. 補助的. 表記. 漢字仮名混. 語表記. 本質的. 必要. 分野. 観. 立場. 広. 語機能. 発展. .. ) 普及. ,社内文書. 利用. 個人文書. .PC. 漢字. 実現. 取. 持. ROM. ,国際仕様. 普及. PC/AT. 始 日本. 互換性. . .. ■ 1990 年代:  1991 年. 分野. 英数. 換. 時代. 入. 文. ,漢字. ,日本 取. 一般企業. 組 変遷. 共通仕様. 発表. 国産主要 PC. 参入 吸収. PC. PC/AT 互. NEC (1997 年 始. 個人. 次第. 処理. DOS/V 路線. ,企業. 端末 概. 的. 日本市場. 進. 先. 広. 漢字・日本語処理. 漢字. DOS/V. PC. 転向). 転向. .海外. ,PC. 低価格化. 普及. 進. ,日本語処理. . 担. 主役. 本格化(1980 年代以降). 以. .. PC. .. ■ 1950 ∼ 1960 年代:  1950 年代. 終. 送受信装置. 利用. 外郭団体 業界. PC 機能 含. 機能 呼. 必要. 使. 日本語. .利用. ,. 前. 国産 PC. 除. ,1980 年代. 扱 日本語処理. 読. .. 始. ) 端末. 作成 文字. 処理.   行的. (. (以下. 穿孔. 印刷. 一般 文字. 利. ,. 文字 半. ,. 漢字. 込. 市場. 機能. .高速印刷. 採用. 英数字. 容易. ,. 光電式. (48 字) 扱. 端末. 当. 入出力. 以来 1970 年代. 漢字. 加. 前提. 入出力装置. 代表的. 方式.  汎用的. .. 1950 年代. 始. .. 始. 88 ∼ 94 字程. . 開発. 始. ■ 1980 年代:. 記号. 処理. 扱. 入出力装置 出. 大文字 26 字. 応用. 住民. .1950 年 商用化. 処理. 用. 1990. 実現 米国.  我. ,. 住所,氏名,. 漢字. 地方自治体. ,多種. 用. 入. 代 入. 会社名,品名,項目名. 高. 多種 出力. 年代. 漢字. 登場. 新聞社 .1960 年代. 半. 官庁. 一部. 日本語情報処理. 始. ,印刷. 漢字自動写植. 利用. 始. 日本語処理. 前. 振. 歴史. 入力. 日本語文 電信. 始.  本稿. 組. 返. ,漢字仮名混. 出力(主 述. 文. 日本語. ). 取. .. .. IPSJ Magazine Vol.43 No.10 Oct. 2002. −1−. 1093.

(2) 日本の情報処理技術の足跡. 文字位置キー. 文字群キー. 亜阿哀 愛挨晃 悪握芦 圧扱或. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12 右手で文字群キー. を打つと「愛」. 左手で文字位置キー. 夜(ヨル). 山(ヤマ). 読み. 母(ママ). 髪(ヘ a). 意味,外来語. 公(ハム). 化(i ヒ). 字の形. 皮(ヒフ). 意(i ミ). 熟語. 図 -2 連想コードの例. 図 -1 多段シフト方式の原理. 漢字・日本語の入力. ■ドラム ( 漢字表 ) 方式  1965 年. 漢字. 扱. 入出力装置. .通称,漢 1954 年. ). 行. 始. 広. .. 新聞業界.  . 後沖電気 漢. 参入. 用. ,. 24 列× 8 行配置. 望. ,右手 文字. 練者. 位置. ,左手. 選択. TTS 化. 式 12 文字. 入力. ,全国. 字盤上. ,文字. 入. 疲労. .1960 年. 発生. 方式. 使. 機構 ,. 機械的移動. 伴. 手. 30 ∼ 50 字/分 字位置. 生 ,位置. 活字 取. 機. 読. 取. 方式. 考案. 力. ,打鍵速度. 議 活. 関係. 表. 付加. 付. 軽. 比. ,1972 年. ,. 社. ). 多. 作. ) ,. ) ,光電 .後. 組合. ,2. 圧 .. 1対1 打鍵. 日米. 入 会. 川上晃(裁判用速記 発明者). 覚 用. .. 開発. 開催. 使 .. 30 ∼ 70. 遅. 用. 体系.  効率. −2−. ,. 2 文字. 方法 広. 43 巻 10 号 情報処理 2002 年 10 月. 可能. ,入力速度. 感圧導電. 対応. .. 片手操作. 入. 漢字入力装置. ,三菱. 選択. .文字. 発生. 付与. 1094. 疲. 速. 機械的 読. 腕. 発生. 文字. 代表的. 方式(日電漢字.  漢字 文字. 時代. ,沖電気,富士通. ■和文タイプ方式 方式. ,1970 年代. 電磁結合方式(日立,東芝. 2 ストローク方式. .. 電子. 持. 方式. 一段選択方式 和文. 文. 軽. 静電結合方式( 電. 付加. 60 列 35 行程度並. 素人向 多段. .. 機構. 開発 製品化. 文字. 方式. 少. 字/分. 1).  従来. 沖電気. 状. 開発 .. 所. 角. 発生 各社. 記事配信. 新聞社. 数. (図 -1).熟. 可能. 発. 東芝.  1 字 的. 中. 加盟地方通信社. 始. 方式. 扱. 文字群. 打鍵. 70 ∼ 100 字/分. 共同通信社. 多段. 2,304 字. 文字群. 押. ■タブレット(ペンタッチ)方式. 原型. 3 列× 4 行. ,右手. 文字. 新興. ,1958 年. 漢. 入力方法. ,所望. .. .. .1 可能. 発注. 発表. 使. .類似. ,左手. 移動. 式漢字鍵盤送信機. 防衛. 1955 年朝日新聞社 試作機. 左右. 持. 生. .読売新聞社. .続. 共同研究. 製品化. 針. TTS(Tele-. ,日本飛行機製作所. 完成. 製作所. 新聞社. 漢字電信印字機(漢字. Typesetting System) 庁 共同研究. 巻. 回. 多段シフト方式  漢字. 表. 最初 連想的. 発 対応. (図 -2). 法. 入力. 可能. 左.

(3) 日本の情報処理技術の足跡. 右 手. 交互打鍵. 考慮. 独自 高. 各指. 負荷. 合理的分配. 配列. 入力速度. 社 利用. .. 教則法.  . 非公開. 開. 入力方式.  . 方式. 鍵盤. 用. ,. ,新興製作所, 開発. ,大量 .. 持. 漢字入力. 法. 推進. ,初期 採用. ,誰. 利用 強. 漢字変換. 支. 単漢字変換. 手軽. ,一致. 法. ,最長. , 使. 辞書. 最長. 候補.  . 方式. 立語. 付属語. 問題. 見出. 語.  今日最 栗原. 願. .. 漢字変換方式 研究. 文. 最初. 文節分. 書. 入力. 文字列. 可能 接続条件.  . 提案. 総当. 沖電気 試作. 藤井. 外電 作成. 実験. 問題. 同音異義語. ,自立語. 利用 大学. 企業. 河田. 文. 効率. 精度. 向上. 学習的構成法. 対象. 向. 提案. ,分野. 母体. .1978 年 9 月. 漢字変換方式. 日本語 必要. 自動的. 自動化. .. 録. 文字列. 数詞. 不可能. 変換. .変換. 漢字単位. 単漢字変換方式. 取. 漢字. 辞書. ,同音異字. 扱. 地名. 接. ,. 分 先処理. 辞書. 案. 用. 速. ,漢字部. 字表記 単語分 付. 付 考. 程遠. 高. 重要. 処理. 特殊文節処理. 接頭語,接尾語 作. 能力. 接辞(数. 接. 「円」,人. 「市」. )付. 語. 接辞. 富. 接. 必要. 「様」 , 登. .. 含. 連結関係. ,1974 年沖電気. 加. 単語辞書. 処理. 特殊処理. 単語. 自立語. . 次. 扱. 方式. 入. 法. 複合語. 方法. 書. .制限. 課題 処理. 標準. ,入力者. ,特殊. ,選択 対応. 加. 方式. ,誤入力率. 固有名詞. ,. .. 入力速度. ,. 熟語. .複合語. 各社. 漢字仮名混. 完全. 修正. 皮切. 製品化. 漢字文字列. 変換. 以上. 2. 3). 書. .日本語. ,引. 意味的. 行. 入. 提案. 限. 開発. 単語. 研究. 容易 落.  同音異義語. 利用). .文節単位. 必要. .1976 年東芝. 文法. 規則性. 間. 方式. 変換処理. 難. JW-10(価格 630 万円) 発表. 正. 書. 研究. 実験 開発. 文字列. 分. 付属語. 入力速度. 本格化. 日本語.  . 方 限定. 高性能化. 単語辞書. 東芝. 判断. 対象. 挿入. 打鍵. 研究所. 一般文章. 人. .. 入. ,変換. ,扱. 相沢. .. 検討. 漢字指定方式. 漢字変換. 試作.  1970 年代後半. [ ] 単語単位. 併記. 自. 変更. 入力. 文節分. 変換. .1973 年 NHK. 文節. 方法. 挿入. .1971 年日本. 次. .変換処理. 工夫. 1967 年. 一. 中心的課. 接続関係. 精度向上. 悪. 対象. 絞. 2. 変換率. 字電文 .. 関 式. 黒崎. 長. 法. 優先順位. 書. 力段階. 次. 調. 付属語. 文. 必. .. 研究. 漢字変換. 漢字変換. 接続条件(動. 一致語. 使用状況. 利用)  . 方. 選択. 意味論的処理(複数. ,単語辞書. 照合,構文解析,意味解析 要 基礎的手法. 原型. 比. 候補. ) 不適当. 対. ,頻度. ,1963 年 特許出. 入力文字列 変換. 次. 必要. .. 的処理(自立語. 使. 九州大. 上. .最長一致. 語. 見. 見. 致語. ,文法的. 数万語. 同音異義語. カナ漢字変換方式. 字分. 少. 照合方式. 活用変化. 題. 行. 平均 2.3 語) 低. 精度. 方式. 較. .. 続. 同音異義語. 辞書. 詞. 併用. 使. 高性能化. 場合. 合. .. 行. 一部. 変換方式. ,熟語辞書. 入力. 熱心. 熟語単位 調査. 法 熟練者. .. 公. . 覚. 成功率. 前提. 組. ,九段. 教育訓練. 適. 体系. ,自動化. 選択. 出現頻度( 処理. 13.6 字) 高. ,入力者. 対. ,自社以外. .. 通常. 対. 低. 2).  鍵盤. 1字. ,100 ∼ 125 /分. 可能. 体系. 調査. .接辞 強弱. 松下. 優 提. .. 数千. 出現頻度( IPSJ Magazine Vol.43 No.10 Oct. 2002. −3−. 1095.

(4) 日本の情報処理技術の足跡. フラッシュランプ. 文字盤 レンズ ターレット. フィルム. プリズム 図 -3 移動文字盤方式の原理. パターン認識入力  文字認識. アナログフォント方式. 音声認識 研究. 終. 認識技術. 進. 特定話者. .音声認識. 装置. 単語登録方式. 実用化. ,特殊. 限定的応用 遠 文字. 書. 筆順. 1,000 ∼ 2,000 字. 認識. 可能. 再入力. 印字. 文. 字. 入力. 活字. 実用. 力. 文字 1970 年代 比重. 占. 発生装置. 国産最初. ,.  1967 年日立. 圧縮. 方式. 字母型 大別. 130 ∼ 160 字/分. 米国 ITEK 社. 索業務. 主流. 43 巻 10 号 情報処理 2002 年 10 月. −4−. 技術導入. 多字種. 持. 開発. 文字. ,. 縮小. 収容. 代 導. 光学的 非常. 使用. 能力. 式. 使用. 低価格. 300 字/分. 原理的. 当時. 文字盤. (図 -3).. 閃光. 表現. 配列. .. 穴. 自動写植機. 用紙. 開発. 電子的. ,35mm. 代. .. 1096. 共. 写真植字機. ,2,304 字種. 文字. 用. .半導体. ,次第. 方式. H-8247 型. .文字 漢字. 印. 文字. 漢字. 方法. 方式 化 伴. 漢字出 大. (複数台 ) 共用. 持. 形式. 印字. 写植. 重要. 文字. 印字位置. SAPTON-N. 種類. 漢字処理. .. 漢字 発生. ,文字. 発生法. 加算機構. 12 列同心円上. ,回転中. 複雑. ,. 使. .印字速度. 点火 ,1 文字. 4 段 24 列入. ■移動文字盤方式プリンタ. 漢字・日本語の出力. 多. 印字位置. 差動歯車 選択. 方式. 漢字. 非常. 活字. 立.  1966 年写研. 比. 回転. 活字. 対. ..  漢字. 一定速度 ,所定. 文字. .. ,誤認識. CAD 図面. 持 組. 約 2,500. 沖. .沖製. 各々復帰 所定. 通常. ,比較的簡単. .新興製. 手書. 新興製作所. ,. (活字輪) 使用. 進. 把握. 漢. 商品化. 放射状. 研究機関. 容易. 場. 扱. 認識. 認識. 化. 入力. 盤上. 研究. 書. 字認識. 電気. 漢字入出力装置. 程. 入 的. 文字認識方式.  最初. 認識. 環境. 直. .文字. 100 語程度. 印刷文字認識. ,1970 年代. ■活字方式プリンタ. 1970 年代. ,日本語入力. .文字認識. 文字認識. 入力. 印刷. 方式. 高速. ,外務省. .. 4). .180 行/分 納入. 情報検.

(5) 日本の情報処理技術の足跡. フィルムなど. フライング スポットCRT. 固定文字盤. 光電増倍管. 整形増幅器. プリントCRT. 図 -4 固定文字盤方式の原理. 主流. ■固定文字盤(フライングスポット)方式プリンタ  文字盤. 文字. 可能 発. 選択. 電子化. 速度. 上 開. 用. 文字. (高解像度写真乾板. 御. 文字. ,CRT. 光信号. 800mm 角. CRT 上. 増幅. 1字 系. 可能. 文字. 増設. 拡大,縮小,回転. 高速. 展開. 比. 演算処理. 必要. 容. 不向. 蓄積管. 機構. 持. .. ■静電式プリンタ. 形 経.  1967 年富士通. 開発. 朝日新聞社. FACOM6501A. 1 文字. 15 × 18. 磁気 方式. ,2,688 字. 制. ,. 紙. 方式. 方. 用. ,整形回路. 記録. 記憶. 文字. 選択. 光電増倍管. 行 ,. X – Y 偏向回路. 操作. 集合. 記憶容量. ,文字. 易. 直線. ,. 対応. 選択. 採. 文字. ,1 文字. 文字. 使用) 収容. 文字. CRT 盤上. 式 少. 方式. .400 ∼ 1000 種. 方式. (JICST) 納入. JEM-3800 漢字. ..  . ,1967 年日本電子産業(JEM). ,日本科学技術情報. 方式. 固定記憶装置. .. 文字種. 1列. 増. 最大 3. 可能. 並. 与. 潜像. ,粉末. (図 -4) .. 作. .2,688 字. 5). ,270 本. 対応. 絶縁処理 扱. 表現. 記憶. ,. 状高電圧. 納入. 施. ,15 字/行. 細. 各 特殊用紙上. 現像. ,. 電荷. ,熱定着. 方式. 93.7 行/分. 速度. .  1967 年共同通信社. ディジタルフォント方式  文字. 的 方式. 方式. 年代半. 写植機. 広. 記憶. 使. ,1990 年代. 表現. ,文字. 格子状. ,当初. 記憶装置. ,何. 漢字. 横×縦. 15 × 18. 当用漢字. 表現. 一部. 文字. 数. 用. .. 略式表現. 得. 許容 最終文書 太. 鷹. 画数. .24 × 24 以上. 多. 字. 表現. 変化 32 × 32. 64 × 64 以上. 十分. ,活字 必要. ,2,592 字. 固定記憶装置. 入. 方式 当時普及. 始. 分. .. 24 × 24. 記憶. ,静電. 電子印刷. 200bit /秒. ,. ■ワイヤドットプリンタ. ,.  複数本. ,. 出力. 問題視. 1 文字. 製品. 伝送. 行. ,速度. 対応. 500 字/. 高価. 最小限. 16 × 18. ,1969 年東芝. 漢. 表現. 1980. .. 方式. 曇. 化. .輪郭方式. 用.  . 方法. 試作. 駆動. 文字. 表 .一般. 使. 近. 得. 用 入. 印刷. 用. 入. 米国 Centronics 社. Model101. .. 成功. 文字 刺激. 場合. 速度. 急速 印字. 18 本. IPSJ Magazine Vol.43 No.10 Oct. 2002. −5−. 発. 7本. 165 字/秒 国産各社. ,. 採用 分野. .英数字 ,5 × 7. 方式. 機構. 式. 表現 .1970 年代. 電磁. IBM. ,1970 年代. ,明朝. 金属製. ,. 1960 年代初. 用. 品質. 細. 1097.

(6) 日本の情報処理技術の足跡. 用. 16 × 18. 数枚. 複写. 漢字. 開発. 取. .. ,比較的低価格. 字. 漢字・日本語処理 .. 12 本. 2列. 普及. 千鳥状. 印字 40 字/秒程度. 漢. 大. 貢献. 配列. ,. 24 × 24 1970 年代. 終. 広. 使. . ■インクジェットプリンタ  1976 年 IBM. 発表. 46/40 型. ,. 流. 粒子 字. 描. 荷電量. 方式. 一定電界中. 制御. 通. 流. ,77 字/秒. 偏向. 印刷. 騒音 製品. 開発. 連続. 粒子流. 噴射. ,印字. ,東. 採用. .引. 立,東 必要. 方式. ,速度. 後. 続. 日. .荷電量制御方式. 遅. 回収. 質. 小型. 開発. 湿式. 回収機構. 化. 文. 高速高品質低. 注目. 機構. ,. 不要. 速度向上. ,. 図. 用. 開発. ,引. 道 開. ,多色印刷 主流. 続. 用. 方式. .. 組. ,1976 年. 高品質機(288. 低価格機. 狙. /. ). 半導体. 製品化. LBP-10. 分野. OA. 取. ,. 乾式. 後端末. 小型. 広. .. おわりに. ■レーザ(電子写真式)プリンタ  1975 年 IBM. 電子写真技術. 印刷. 発表 引. 世界. 金. ,. 古 光. 後. 潜像. 紙 転写. 熱定着. 超. 高性能. ,帯電. 体系化. 年代以前. / 容易. ,1977 年. 漢字機構 付加. 日立工機. 共同. .  . 刺激. ,1977 年 1979 年 日電. 日立. 7,000 行/分(英数字 15,000 行/分. 出荷. 西独 Siemens 社. 導入. 高速漢字 理 分野. 漢字. 導入. 着手. 印刷可),. .富士通. 漢字化 登場. 行. .. ,事務処. 本格的.  一方. 1098. 開発. 場合.漢字. 用紙. 始. . 扱. 低速高品. 43 巻 10 号 情報処理 2002 年 10 月. −6−. 画. 年 普及. .. 向. ,最. 文. 入力. 紹介. .. 出力. 年. .. 漢字・日本語処理 歩. 年. 出. .漢字・日本語処理. 漢字. 1978 年. 「JW-10」 発表. 発表. 1 万行. 拡大. 漢字. 返. ,JIS「情報交換用漢字符号系」 制定,東芝. 代以降本格的. ,英数字. ,文字. 振. 主要. 吸着. 240. 歴史. 日本語. .. 利用. 横方向. 年. 感光. .発表当時. 印刷. 期的. ,強度 走査. 方式. 連続普通紙. 持. 複写機. 用 作. 同様. 印字密度.  漢字・日本語処理. 実用化. 回転鏡. 上 文字. /分. 3800. .電子写真. Xerox. 変調. 用. 機. ,今日. 1980 年 至. 大. 揺籃期 問題. 課題. 1980 漢字仮名混. 先人. 取. 組. 参考文献 1)安田寿明 : 我が国の新聞社における漢字情報処理,情報処理,Vol.10, No.5, pp.340-347 (Sep. 1969). 2)川 上  晃 他 : タ ッ チ 法 に よ る 漢 字 入 力, 情 報 処 理,Vol.15, No.11, pp.863-867 (Nov. 1974). 3)森  健 一 他 : か な 漢 字 変 換, 情 報 処 理,Vol.20, No.10, pp.911-916 (Oct. 1979). 4)長井 担 : 漢字入出力装置の動向と技術的問題点,情報処理,Vol.10, No.5, pp.320-332 (Sep. 1969). 5)長谷川実郎 : 高速漢字プリンタ,情報処理,Vol.10, No.5, pp.279-284 (Sep. 1969). (平成 14 年 9 月 9 日受付).

(7)

参照

関連したドキュメント

1|ひてた、公より禁中様御作事の時、国々のにんそくともつ

日本の生活習慣・伝統文化に触れ,日本語の理解を深める

固体廃棄物の処理・処分方策とその安全性に関する技術的な見通し.. ©Nuclear Damage Compensation and Decommissioning Facilitation

※ 本欄を入力して報告すること により、 「項番 14 」のマスター B/L番号の積荷情報との関

本研究科は、本学の基本理念のもとに高度な言語コミュニケーション能力を備え、建学

本研究科は、本学の基本理念のもとに高度な言語コミュニケーション能力を備え、建学

本研究科は、本学の基本理念のもとに高度な言語コミュニケーション能力を備え、建学

処理処分の流れ図(図 1-1 及び図 1-2)の各項目の処理量は、産業廃棄物・特別管理産業廃 棄物処理計画実施状況報告書(平成