• 検索結果がありません。

IT好き放題:翻訳バンク

N/A
N/A
Protected

Academic year: 2021

シェア "IT好き放題:翻訳バンク"

Copied!
1
0
0

読み込み中.... (全文を見る)

全文

(1)最. する,クラウドソースで翻訳する,既存データの権 近のコラムの中で「好き勝手に書いてよい欄. 利者に許諾をいただく等,あらゆる方法で集めら. だ」という一文に遭遇し,シニア冥利と思い書きは. れています.ここで,日本で 1 年間に生産されて. じめました.. いる翻訳データの全体量を考えてみましょう.翻.  2020 年オリンピック・パラリンピックの東京開. 訳産業の年間総売り上げは 2,000 億円と言われてい. 催が決定し日本中盛り上がっています.訪日外国人. ます.1 文字 10 円とすると 200 億文字になります.. も順調に増え,政府目標も大幅に上方修正されまし. 1 単語 2 文字として 100 億語.1 文 20 単語とすると. た.日本語という言葉の壁と,この壁を越える技術. 5 億文です.これはきわめて膨大な量です.これを. がクローズアップされて,グローバルコミュニケー. 1 カ所(『翻訳バンク』と呼びます)に集めて,『翻訳. ション計画. ☆1. という多言語の音声翻訳システムの. バンク』の全データで自動翻訳システムを構築すれ. 社会実装を目指す国家プロジェクトが着々と成果を. ば相当の高品質が実現できます.さらに,構築され. 出しています.. た高品質の自動翻訳システムで下訳を作成し校正す.  そんな中,過日,第一級の翻訳者の方から,英語. [シ ニ ア コ ラ ム]. I T. くなったと伺いました.この目覚ましい品質向上の 背景に技術革新があります.翻訳データ(原文と翻 訳の対を大量に集積したもの)に基づく手法が発明 され熾烈な研究競争が行われアルゴリズムが日進月 歩し続けています.構文解析を使う事前並べ替え型 の統計翻訳や LSTM. ☆2. 好き放題. on Favorite es. IT. も棒にもかからなかったけれど,最近目に見えて良. 基 応 専 般. Messag. から日本語への自動翻訳システムは,かつては箸に. [No.75]. 翻訳バンク. を使うニューラルネット翻. 訳で大きく翻訳品質が改善しました.. ることにすれば,翻訳作業全体の効率化を実現でき.  翻訳データに基づく手法には 2 つの柱がありま. ますから,翻訳データの集積が加速されます.翻訳. す.①翻訳アルゴリズムと②翻訳データです.デー. データを再利用するこのエコシステムが完成すれば,. タ量が同じならアルゴリズムが翻訳品質を決定し,. 想像を絶する高品質な自動翻訳システムが出現する. 逆に,アルゴリズムが同じなら翻訳データ量が品質. でしょう.最近,私はこの『翻訳バンク』の実装・拡. を決定します.研究では,共通のデータを使ったベ. 張に東奔西走しているところです.すでに,中央官. ンチマークをしますので,翻訳データは与えられた. 庁,自治体,観光や飲食にかかわる民間企業,各種. 条件と捉え,研究者は翻訳データの収集を軽視しが. メディア企業などのご協力を得ることができており,. ちです.一方,翻訳データの収集は自動翻訳システ. NICT に大量の翻訳データが集まり始めています.. ムの実用化には不可欠です.昨今の人工知能が深層.  翻訳のイノベーションは本当に起こるのでしょう. 学習のアルゴリズムとビッグデータの対で成立して. か? イノベーションのジレンマに囚われて結局何. いるのと同じ構図です.データがないと人工知能と. も起こらないのでしょうか? 私には,イノベー. 呼ぶところの機能は実現できません.. ションの可能性に気付いた人々が発しているシグナ.  この翻訳品質への貢献が大きい翻訳データを作成. ルがたくさん見えています.オセロゲームのように. する方法はいろいろあります.Web からクロール. 一気に局面は変わり,この夢が 2020 年以前に必ず 実現するでしょう.私はこのイノベーションを楽し む予定です.皆さんもいかがですか? (2017 年 1 月 25 日受付). 隅田英一郎 Eiichiro SUMITA 国立研究開発法人 情報通信研究機構 [正会員] [email protected] NICT フェロー. (株)日本アイ・ビー・エム東京基礎研究所,(株) 国際電気通信基礎技術研究所を経て,NICT 入所.京都大学大学院博士(工 学) .機械翻訳,e ラーニングの研究開発に従事.. ☆1. ☆2. http://www.soumu.go.jp/main_content/000285578.pdf http://www.soumu.go.jp/main_content/000395359.pdf http://gcp.nict.go.jp/about/index.html https://en.wikipedia.org/wiki/Long_short-term_memory#/media/ File:Long_Short_Term_Memory.png. 情報処理 Vol.58 No.4 Apr. 2017. 327.

(2)

参照

関連したドキュメント

全国の 研究者情報 各大学の.

情報理工学研究科 情報・通信工学専攻. 2012/7/12

瀬戸内千代:第 章第 節、コラム 、コラム 、第 部編集、第 部編集 海洋ジャーナリスト. 柳谷 牧子:第

社会学文献講読・文献研究(英) A・B 社会心理学文献講義/研究(英) A・B 文化人類学・民俗学文献講義/研究(英)

山階鳥類研究所 研究員 山崎 剛史 立教大学 教授 上田 恵介 東京大学総合研究博物館 助教 松原 始 動物研究部脊椎動物研究グループ 研究主幹 篠原

人類研究部人類史研究グループ グループ長 篠田 謙一 人類研究部人類史研究グループ 研究主幹 海部 陽介 人類研究部人類史研究グループ 研究員

人類研究部長 篠田 謙一 人類研究部人類史研究グループ グループ長 海部 陽介 人類研究部人類史研究グループ 研究主幹 河野

翌月実施).戦後最も早く制定された福祉法制である生活保護法では保護の無差別平等