• 検索結果がありません。

41 ヒューマンコンピュテーションとクラウドソーシング クラウドアクセシビリティ クラウドソーシングによる障害者支援 Accessibility + Crowdsourcing = Crowd Accessibility 高木啓伸 Hironobu Takagi 日本アイ ビー エム ( 株 ) 東

N/A
N/A
Protected

Academic year: 2021

シェア "41 ヒューマンコンピュテーションとクラウドソーシング クラウドアクセシビリティ クラウドソーシングによる障害者支援 Accessibility + Crowdsourcing = Crowd Accessibility 高木啓伸 Hironobu Takagi 日本アイ ビー エム ( 株 ) 東"

Copied!
6
0
0

読み込み中.... (全文を見る)

全文

(1)

1. は じ め に

人が学び,働き,日常生活を送るうえで視覚や聴覚は 重要な役割を果たしている.黒板を読むことのできない 学校生活や商品を見ることのできない買い物,相手の声 が全く聞こえない会議を想像できるだろうか? 視覚や 聴覚に障害をもつ人々はまさにそうした環境の中で工夫 しながら日々を過ごしている.この困難な状況を支援す る技術が障害者支援技術(Assistive Technology)である. 例えばメガネ型カメラデバイスを用いて目の前にある文 字や商品を撮影・認識して読み上げることができれば視 覚障害者にとって非常に有用であることは容易に想像で きる.周囲の音声を録音・認識して文字として表示すれ ば聴覚障害者が会議に参加することもできるだろう.障 害者支援技術はまさにそうした「夢」の実現へ向け進歩 してきた. 課題はその精度にある.光学文字認識(OCR: Optical Character Recognition)をはじめ,物体認識,音声認識 といった認識技術は数十年にわたり徐々に精度を向上さ せてきた.しかし,撮影品質や認識対象の質と量,録音 音声の音質や発話内容によってまだまだ精度に大きなば らつきがあり,現実の障害者のニーズを満たすレベルに は達していないのが現状である. そこで生まれてきたのが障害者支援にクラウドソーシ ングを用いようとするアプローチだ.著者らはこれを「ク ラウドアクセシビリティ(Crowd Accessibility)」と呼 んでいる.視覚障害者が商店の中で撮影したラベルの文 字を人の手で認識すれば,合成音声で読み上げることが 可能になる.音声認識の誤りをインターネット越しにリ アルタイムで修正できれば,会議に参加する聴覚障害者 の強力なサポートになる.クラウドアクセシビリティは まさに「夢のサービスを現実にする」手段だといえよう. クラウドソーシングは時として「安く人を働かせるため の仕組み」と誤解されることもあるが,ここでクラウド ソーシングが実現しようとしているのは,人の知とコン ピュータの知を融合し,視覚や聴覚に障害をもつ人々を 支援するための新たなサービス群なのである. 本稿では,まずコンピュータの出現により大きく進 化した障害者支援技術の歴史を概観する.次に現在各国 で試行されている新たなサービス群について,視覚代行 サービス,書籍のディジタル化,動画への字幕付与,ゲー ミフィケーションといった観点から紹介する.最後に, 日本におけるクラウドソーシングの担い手としての高齢 者の可能性について述べ,今後の展望を考察する.

2. イノベーションと障害者ニーズ

障害者支援技術はその名のとおり障害者という特別 なユーザを対象にした技術である.しかしその強いニー ズは多くの歴史的な発明のきっかけとなってきた.古い 例として,電話はグラハム・ベルが聴覚障害者用のコミ ュニケーション器具開発過程で発明したと伝えられてい る [Pasachoff 11].また,文字入力キーボードの起源の 一つに上肢障害者用の文字入力機器があるともいわれて いる.本稿と関連の深い各種認識技術もその源流に支援 「ヒューマンコンピュテーションとクラウドソーシング」

クラウドアクセシビリティ

─クラウドソーシングによる障害者支援─

Accessibility + Crowdsourcing = Crowd Accessibility

高木 啓伸

日本アイ・ビー・エム(株)東京基礎研究所

Hironobu Takagi IBM Research - Tokyo, IBM Japan, Ltd.

[email protected], http://researcher.ibm.com/person/jp-TAKAGIH

井床 利生

(同  上)

Toshinari Itoko [email protected], http://researcher.ibm.com/person/jp-ITOKO

齋藤  新

(同  上)

Shin Saito [email protected], http://researcher.ibm.com/person/jp-SHINSA

小林 正朋

(同  上)

Masatomo Kobayashi [email protected], http://researcher.ibm.com/person/jp-MSTM

Keywords:

crowdsourcing, accessibility, assistive technologies, object recognition, text digitization, video captioning.

(2)

技術としての側面をもっているものが多い.OCR 技術 の歴史をひもとけば,最初の実用機器として視覚障害者 のための読書器「Kurzweil Reading Machine」にたど り着く.CCD スキャナ上に置いた文書や書籍といった 紙面の文字を OCR で自動認識し合成音声で読み上げる ことのできる世界初の製品である.1974 年に全米視覚 障害者連盟とともに発表されたこの装置は評判を呼び, OCR技術のみならずスキャン技術や音声合成技術に とっても大きなマイルストーンとなった.また,音声認 識技術も当初から聴覚障害者の支援を主な用途の一つに 数えていた.最近のスマートフォンに搭載されている音 声対話システムの開発過程でも障害者ニーズが参照され ているといわれている.さらには,テレビの字幕システ ムももともとは聴覚障害者のために開発された技術だ. 1970年代に登場した後,移民の多いアメリカにおいて 英語初級者にとっての有用性が高く評価され広く普及し たのである.現在,音声認識技術は字幕作成現場におい ても重要な役割を担っている.ほかにも,視覚障害者の ための自動運転車など,障害者ニーズをベースにした認 識技術のイノベーションには枚挙に暇がない. クラウドアクセシビリティという観点から源流をたど れば,そのアイディアは「クラウドソーシング」という 言葉が登場するはるか以前から存在していた*1.1988 年に日本で開始された「てんやく広場」は最初期の例の 一つである*2.点字は 6 個の点の凹凸により文字を表現 する表記法であり,26= 64 通りの文字しか表現できな い.そのため日本語を表記するには特殊な記法が必要と なる.その変換作業が「点訳」である.多数の例外を含 む変換ルールに習熟した点訳者は常時不足しており,ま た紙面に物理的な穴をうがつ点字文書は修正をはじめと した編集が非常に困難である.1980 年代半ばにパーソ ナルコンピュータを用いて点字を編集する点字ワープロ が開発されたことにより必要スキルの軽減と編集効率の 向上が実現されたが,一方,各地の点訳作業者が同じ書 籍を重複して点訳する非効率が顕著になってきた.そこ で 1988 年に誕生したのが,点字ワープロで作成したフ ァイルをネットワークで共有する「てんやく広場」であ る.これにより,一冊の書籍を分割し多くのボランティ アによって点訳作業を同時並行することも可能になっ た.大規模な辞書などの点訳も容易になり,点字書籍が 大きく増加する契機となったのである. 米国ではさらに大規模な取組みが進んでいる.前述の Kurzweil Reading Machineの成功後,1980 年代には

OCR製品を扱う企業が数多く誕生した.そのうちの一 社であるアーケンストーン社が 1990 年代にディジタル テキストを共有するサービスを開始した.このサービス は 2000 年に「Bookshare」として独立し,現在に至る まで活発に活動している*3.ベストセラー書籍が出版さ れる際には発売直後から数多くのボランティアやユーザ がディジタル化に携わり,出版当日にはディジタル化が 完了するほどである.2007 年には米国教育省から 3,200 万ドルの資金援助を受け,教育用書籍のディジタル化 サービスも提供している. 障害者支援分野と並行して,書籍ディジタル化のク ラウドソーシングは歴史的書籍の保存や検索を可能に するための全文テキスト化分野においても発展してき た*4.一例として,オーストラリア国立図書館による新 聞ディジタル化プロジェクト*5,EU における IMPACT プロジェクト*6などがある.この分野で近年最もインパ クトがあったイノベーションは reCAPTCHA*7の登場で あろう.reCAPTCHA は認証システムの一部として動 作する.CAPTCHA は人がアクセスしていることを確 認するために OCR による自動認識の難しいゆがんだ文 字列を人が目で見て入力することを要求するシステムだ が,reCAPTCHA は同時に「ディジタル化対象文書の中 で OCR の困難な単語」を表示することでユーザを「気 付かないうちに」ディジタル化作業に参加させてしまう. この発明によりアルファベット利用言語のディジタル化 が大きく前進したといわれている. 1990年代後半になると,Web の急速な普及により障 害者の Web アクセスを保障する「Web アクセシビリ ティ」が書籍アクセシビリティと並ぶ重要課題として認 知されるようになった.その議論の中から 1998 年に提 案されたアイディアが ALT-server*8である.ある Web ページ上に画像の代替テキスト(alt 属性)が存在して いない場合に「誰か」が付与できる仕組みを提供する とともに,それを共用データベースに蓄積し一度付与 した代替テキストを誰でも再利用できるようにすると いう提案であった.このアイディアはその後いくつかの 方法で実装されることになる.ワシントン大学で開発さ れた WebInSight は OCR を用いて文字を含む画像の代 替テキストを自動生成する機能をもち,誰でもその認識 結果を修正できることができた [Bigham 06].CMU で 開発された ESP Game とその後継である Google Image

Labelerは画像へのテキスト付与作業のゲーミフィケー ションを試みた [von Ahn 04].2008 年に著者らのグルー プが公開したソーシャルアクセシビリティプロジェクト [Takagi 08]ではインタラクティブな編集ツールを提供 し,代替テキストに加え見出しテキストの付与や読上げ 順序調整のクラウドソーシングを実現した. *1 クラウドアクセシビリティ関連技術のサーベイとしては, [Bigham 11]を参照. *2 現在のサピエ(http://www.sapie.or.jp/)の前身. *3 http://www.bookshare.org/ *4 全文テキスト化関連技術のサーベイとしては,[高木 11] を参照. *5 http://trove.nla.gov.au/ *6 http://www.impact-project.eu/ *7 http://www.google.com/recaptcha *8 http://www.w3.org/WAI/altserv.htm

(3)

次章では,近年主流になりつつある「人の知とコン ピュータの知の融合」,すなわち自動認識技術との連携 に主眼を置くクラウドアクセシビリティサービスについ て,具体例をあげてご紹介したい.

3. クラウドアクセシビリティ技術例

3・1 視覚代行サービス 視覚障害者が「今,目の前にあるこの商品は何か」,「こ の広場に何があるか」といった疑問を日常生活において もつことは想像に難くない.そこで近年活発になってき たのがスマートフォンを活用した視覚代行サービスであ る.例えば IQ Engines 社が提供していた oMoby は写真 画像からの物体認識とクラウドソーシングを組み合わせ たサービスだ.専用アプリで何かの写真を撮影すると自 動的に画像内のオブジェクトが認識され,読み上げられ る.すでに登録されている企業のロゴなどはこの段階で 認識される確率が高い.自動認識可能な対象物が見つか らなかった場合はクラウドソーシングにより認識される ことになる.IQ Engines 社ではトレーニングを受けた 作業者が常時待機しており数分後には説明テキストが送 られてくる.人手によって作成されたテキストは画像認 識エンジンの学習データとしても活用され,徐々にサー ビスの自動化が図られるという仕組みである. 有用性が明確であり今後の発展も期待されるサービス ではあるが,いくつかの大きな課題がある.一つ目は省 力化の技術的な難しさである.対象物に制限のない物体 認識は現在の技術レベルでは実現困難だ.著者らのテス トにおいても自動認識可能なケースは「著名な飲料のラ ベルが明らかに撮影されている場合」などに限られた. 持続可能なサービスの実現には認識精度向上によるコス ト低減が不可欠であり,人力での認識結果をより有効な 学習につなげる技術フレームワークが必要になる.今後 の研究開発が期待される分野である.もう一つはビジネ スモデルの問題である.1 枚の画像の説明を得るために, 果たしてユーザはいくら支払うであろうか? 積極的に 利用するユーザは,果たして何人いるだろうか? ビジ ネスモデルは障害者支援サービスが常に直面する課題で ある*9

拡張現実(AR: Augmented Reality)などの隣接領域 技術と連携しながら視覚代行サービスを実証するための 努力もさまざまな形で開始されつつある.AR は広告分 野などにおいて近年盛んに実サービス化されている技術 である.視覚を代行するという夢のサービスを現実社 会の中で持続可能なものにするための実験がいよいよ始 まった感がある. 3・2 書籍のディジタル化 前章で紹介したように書籍ディジタル化には長い歴史 があり,数多くのシステムが開発されてきた.しかし日 本においては,日本語の言語的な豊かさに起因する独特 の困難がある.前述の Bookshare では OCR による認識 後に英文スペルチェックをかけるという手順が用いられ ているが,26 文字のアルファベットで表現され単語間 がスペースで区切られる言語では,これだけでも一定品 質のディジタル化が可能である.一方,日本語には常用 漢字 2 136 字,旧字・異体字も含めれば約 10 000 字と いう膨大な文字種があり OCR 精度の向上を困難にして いる.自動認識精度の品質は人手での校正コストとして 跳ね返ってくる.また,縦書き・横書きの混在やルビを はじめとする独特の記法なども校正コストを増加させる 原因となる. そこで著者らは日本語に最適化された全文テキスト化 クラウドソーシングシステムを開発した.このシステム は書籍校正作業をいくつかのステップに分割しそれぞれ に簡便なクラウドソーシングインタフェースを提供する ことで作業効率向上を図るものであり,2013 年 10 月よ り(福)日本点字図書館が実施している実証実験*10 も活用されている.この仕組みを図 1 に示す.最も人手 を要する OCR 結果テキストの校正作業がクラウドソー シングされるため,専属スタッフは OCR 処理や見出し 編集作業といった専用ツールや専門スキルを必要とする 作業に注力できるようになる.著者らのシステムは,日 本語 OCR における典型的な誤認識が(a)同一文字の 誤り,(b)ルビ箇所の誤り,(c)複数文字にわたる誤り の 3 種に分類できる点に着目し,各誤認識の修正に対 応した三つの作業画面(図 2(a)~(c))を提供する. (a)一文字校正は IMPACT プロジェクトの成果である CONCERT [Neudecker 10]のインタフェースを利用し ており,ある文字として認識された文字を一覧表示する ことで通読では見落としやすい間違いの一括修正を可能 にする.(b)ルビ校正は文字サイズの問題で OCR が誤 *9 IQ Engines 社は米国政府から資金援助を受けサービス提供し ていたが,2013 年 8 月に米国 Yahoo! 社により買収されること が発表された. 図 1 日本点字図書館による書籍ディジタル化実証実験の概要 (DAISY は障害者向けディジタル図書の国際標準規格) *10 http://www.nittento.or.jp/press/pr131015_ tdaisy.html

(4)

認識しやすいルビ文字の確認・修正に特化した画面であ る.(c)文字列校正では「の子だ」を「の,丁だ」と誤 認識したケースなど,前後の文字をまとめて編集すべき 箇所の確認・修正を行う. これらのクラウドソーシング校正を経たテキストは 一定の読書体験を提供できるレベルには達しているもの の,トレーニングを受けたベテラン校正者の精度には及 ばず,効率と精度の一層の向上が求められる.一つのア プローチとして,IQ Engines 社が画像認識において行っ たように,校正結果を OCR エンジンの学習データとす ることで認識精度向上の可能性がある.しかし,ここで 現実には信頼性の高い学習データの選別が大きな課題と なる.著者らの実験では,すべての校正結果を学習デー タとした結果,逆に認識精度が下がってしまうケースも あった.原因を探ると,誤った校正結果や,画像だけで は本来判別不可能なはずの文字を人が文脈から推測して 校正した結果を学習してしまったことが判明した.法制 化や DRM の問題,新フォーマット EPUB3 の登場といっ た話題も含め,電子書籍時代の書籍アクセシビリティを 巡ってはまだまだ紆余曲折が予想される.誰もが読みた い書籍を読める時代を目指し,さまざまな側面から技術 開発が進むことを期待している. 3・3 動画への字幕付与とゲーミフィケーション インターネット上で爆発的普及を見せた動画コンテ ンツは教育現場や企業組織の中でもその存在感を増して いる.Kahn Academy*11が草分けとなって数千~数万 規模の教育動画を無償公開する MOOC(Massive Open Online Course)の動きが活性化しており,また企業内 においては遠隔会議や会議録画コンテンツが盛んに活用 され始めつつある.しかし,聴覚障害者の動画アクセシ ビリティはこれまでテレビ番組や映画を中心に考慮され てきたため,インターネット動画のアクセシビリティは 極めて遅れた状況にある [Kobayashi 12].インターネッ ト動画の特徴はその多様性,すなわち「ロングテール」 のテール部分にあろう.ここでは,ごく少数の人にとっ て重要な大量のコンテンツのアクセシビリティをいかに 効率良く向上させるかが問われる.

長 妻 ら が 提 案 し た Collaborative Caption Editing System(CCES)[Nagatsuma 12] は,コンテンツを 10 秒程度のトラックに細かく分割することにより多人数で の字幕作成を可能にするシステムである.図 3 に示すと おり,各作業者には連続したトラックを最大 10 個程度 まとめて分配する.キーボードフォーカスのあるトラッ クの音声と映像はループ再生されており,それを繰り返 し視聴しながら字幕を書き起こすことができる.各作業 者によって入力された作業結果はまとめられ,最終的な 調整を加えたうえで字幕の完成となる. 著者らのグループで CCES を使い英語動画の字幕を作 成していたところ,英語リスニングの良いトレーニング になるという声がメンバの中から上がってきた.そこか ら発想したのが,字幕作成をゲーム化し,外国語を学習 しながら字幕を作成して動画のアクセシビリティを向上 させるという一石二鳥のアイディアだ.CapCap はその アイディアを実装したシステムである(図 4).このシ ステムは英語を母国語としないプレーヤ間のスキルに大 きな差があることを踏まえて設計されている.まず,参 加インセンティブの一つとして参加者ランキングを提示 するが,ここで個人ランキングではなくチーム制をとる. これは「集団への貢献による動機付け」というソーシャ 図 3 字幕作成画面. (a)字幕作成対象の動画が繰り返し再生される. (b)字幕入力欄は 1 トラック 1 行で表示される 図 4 CapCap ラウンドの画面. (a)字幕作成対象の動画が繰り返し再生される.(b)字 幕テキスト入力ボックス.TYPE ラウンドではここは空 白であり,FIX ラウンドでは修正対象のテキストがあら かじめ入力されている.(c)ラウンド数や得点,残り時 間が表示される *11 http://www.khanacademy.org/ 図 2 3 種の校正クラウドソーシングインタフェース

(5)

ルゲームでよく見られる手法でもある.また,1 トラッ ク分の字幕作成を基本的に一人の作業者が担う CCES と 異なり,複数の参加者が一つのトラックに貢献する.そ の仕組みは以下のとおりである.プレーヤがゲームに参 加すると対戦相手がランダムに決められる(ただし,こ の相手が画面に表示されることはない).各ラウンドで二 人のプレーヤが同じトラックに字幕を付けるが,一方の プレーヤは一から字幕を書き起こす「TYPE」ラウンドを, 他方のプレーヤは以前のゲームで他のプレーヤが書き起 こした字幕を修正する「FIX」ラウンドを行う.両者の 入力結果が一致すればするほど各プレーヤに高得点が与 えられるルールである.一致度は各入力を単語のシーケ ンスとみなしたペアワイズ文字列整列によって判定する. 各トラックの字幕作成は 1 回のラウンドだけで完了す るわけではなく,TYPE ラウンドと FIX ラウンドの繰 返しを通じ複数のプレーヤによって順次作業される.ト ラックが初めて FIX ラウンドでプレイされるときには 自動音声認識の結果が入力として与えられ,そうでない ときには直前の TYPE ラウンドと FIX ラウンドの結果 を文字列整列によってマージした結果が与えられる.こ の繰返しにより字幕の品質が高められるのである.FIX ラウンドで一定回数連続して修正がなされない場合にそ のトラックは完了したとみなされ,これまでの作業結果 をマージしたものを最終的な字幕とする.このマージは すべての TYPE および FIX ラウンドの結果を対象とし, A*探 索 ア ル ゴ リ ズ ム を 用 い た 単 語 列 の 多 重 整 列

(Multiple Sequence Alignment: MSA [Naim 13])によっ て行う.著者らが行った実験では,完了とみなされた 60 トラックにおける WER(Word Error Rate)は 4.0%で あり,音声認識結果の 8.4%と比べ大幅な向上が見られ た.また,全トラック間の WER の分散も大きく減少した. これは,参加者のほとんどがネイティブでないにもかか わらず安定して高い精度が得られることを示している. さらに,ボーナスラウンドとして「SPEAK」ラウン ドも設けた.ここではプレーヤは字幕として表示すべき 内容をマイクに向かって話す.音声は音声認識エンジン によりテキストに変換される.二人のプレーヤの入力に 対しマッチングを行うのは他のラウンドと同様である. しかし実際にプレイしてみると,音声認識エンジンのも つ音響モデルがネイティブの発音に基づくため日本人の 発音ではなかなか正しく認識されないことがわかり,良 い練習になる. 先日,クラウドソーシングによって多言語字幕作成 を行う動画配信サービス Viki*12が楽天に買収されたこ とが話題になったが,クラウドソーシング型の字幕・書 き起こしサービスとしては Amara*13や PodCastle*14 などが有名である.また,Duolingo*15は第二言語学習 を主目的とするプラットフォームだが,追加機能として 動画の字幕作成に貢献することができる.学習の動機付 けとしてスキルや進捗の可視化といったゲーミフィケー ションの仕組みを採用している.スマートフォン版インタ フェースも提供されており,隙間時間を使って貢献する というクラウドソーシングのコンセプトと親和性が高い と考えられる.究極的には,動画中の音声情報を 100% 認識可能であればクラウドソーシングによって認識誤り を正す必要はない.しかし,言い回しや表記の調整,非言 語音声の表現などについてはいずれにしろ人の手が必要 になる.今後も音声認識技術の進歩と歩調を合わせ,字幕 作成のためのさらなる技術開発が進められるに違いない.

4. 日本におけるタスク担い手の課題

クラウドアクセシビリティを現実世界の中で持続可能 なサービスとして展開するために避けて通れないのが,作 業者確保の課題である.国際的なクラウドソーシングサー ビスの中では Amazon Mechanical Turk(MTurk)*16

が広く利用されているが,その作業者は 9 割が米国人と インド人で占められており日本人は非常に少ない [Ross 10].日本においてサービスを展開するためには日本語 を解する新たな作業者層の発掘が必要である.また,言 語だけでなく文化の問題も重要だ.例えば,著者らが oMobyで「煎餅」の写真をリクエストしたところ「Food」 とだけ説明された経験からもその必要性は明らかであ る.最近,日本国内でもクラウドソーシングの担い手を 増やすための努力が活発になっている.ココナラ*17 Yahoo!クラウドソーシング*18などは特にマイクロタス クに焦点を当ててサービスを展開しており,クラウドア クセシビリティと親和性が高い.将来的にはこれらを活 用したクラウドアクセシビリティサービスが登場するか もしれない. 著者らはクラウドアクセシビリティの担い手としての 高齢者層に注目している.日本の高齢者層は「高齢者の 定義を(日本だけ)変更すべき」という議論が実際に起 こるほど知力・体力ともに高いレベルにある.金銭的・ 時間的に余裕がある人も多い.障害者支援に興味をもつ 層も厚く,1 日のうちわずかな時間で貢献できる仕組み が整えば多くの参加者が見込めるはずである.著者らが このことに気付いたのは,前述のソーシャルアクセシビ リティプロジェクトにおける最多貢献者が定年を控えた 方であることが判明したときであった.彼は「(退職後に) 手に入れる時間を使って社会的に意味のある活動をした *15 http://www.duolingo.com/ *16 https://www.mturk.com/ *17 http://coconala.com/ *18 http://crowdsourcing.yahoo.co.jp/ *12 http://www.viki.com/ *13 http://www.amara.org/ *14 http://podcastle.jp/

(6)

い」という明確なモチベーションをもっていた.世界一 の超高齢社会となっている日本には,このようなモチ ベーションをもつ高齢者が数多く存在している.著者ら のグループでは,このような高齢者層の活力を生かす新 たなサービスの実現を目指し,科学技術振興機構(JST) の支援のもと東京大学とともに「高齢者クラウド」とい う研究開発プロジェクトを進めている*19.3・2 節で紹介 した日本点字図書館の実証実験はこのプロジェクトの一 環として実施しているものだ.そのため作業者として高 齢者を歓迎する仕組みになっている.担い手の確保はク ラウドソーシングにおいて本質的課題である.米国では MTurkが安定的な作業者供給源となることでさまざま なクラウドソーシングサービスが発展してきた.日本に おいても高齢者をはじめとした担い手とタスクを結び付 ける仕組みが発展していけばクラウドアクセシビリティ への取組みもさらに活発になるに違いない.

5. ま  と  め

本稿ではクラウドソーシングを障害者支援に活用する 「クラウドアクセシビリティ」について概説した.障害 者支援分野では伝統的に人々の力を集める活動が数多く 行われてきたこともあり,クラウドソーシングというア プローチが自然と受け入れられている.さらには,認識 技術(コンピュータの知)とクラウド(人の知)の融合 によって,視覚代行,書籍ディジタル化,字幕作成など のサービスを持続可能な形で実現できる可能性も見えて きた.日本におけるタスク担い手の発掘は大きな課題で あるが,高齢者層をはじめとする「鉱脈」も存在している. 人間の感覚を代行するという「夢」を達成するための重 要技術として,クラウドアクセシビリティへの取組みが さらに活発になることを期待してやまない.2 章で述べ たように障害者ニーズから生み出された技術の中には当 初の予想を超え一般化したものも数多い.クラウドアク セシビリティこそがクラウドソーシングを世の中により 広く普及させる先鋒になり得るという期待も,突飛なも のではないのではないだろうか. 謝 辞 本稿に紹介した研究の一部は(独)科学技術振興機構 (JST)の研究成果展開事業【戦略的イノベーション創 出推進プログラム】(S-イノベ)の支援によって行われ たものです.

◇ 参 考 文 献 ◇

[Bigham 06] Bigham, J. P., Kaminsky, R. S., Ladner, R. E., Danielsson, O. M. and Hempton, G. L.: WebInSight: Making

web images accessible, Proc. ASSETS’06, pp. 181-188, ACM (2006)

[Bigham 11] Bigham, J. P., Ladner, R. E. and Borodin, Y.: The design of human-powered access technology, Proc. ASSETS’11, pp. 3-10, ACM(2011)

[Kobayashi 12] Kobayashi, M., Takagi, H., Fukuda, K. and Nagatsuma, R.: Pilot deployment of HTML5 video descriptions,

CSUN(2012)

[Nagatsuma 12] Sobhi, A., Nagatsuma, R. and Saito, T.: Collaborative caption editing system - Enhancing the quality of a captioning and editing system, CSUN(2012)

[Naim 13] Naim, I., Gildea, D., Lasecki, W. and Bigham, J.: Text alignment for real-time crowd captioning, NAACL(2013) [Neudecker 10] Neudecker, C. and Tzadok, A.: User collaboration

for improving access to historical texts, LIBER Quarterly, Vol. 20, No. 1, pp. 119-128(2010)

[Pasachoff 11] Pasachoff, N., Gingerich, O., 近藤隆文:グラハム・ ベル―声をつなぐ世界を結ぶ,オックスフォード 科学の肖像,大 月書店(2011)

[Ross 10] Ross, J., Irani, L., Silberman, M. S., Zaldivar, A. and Tomlinson, B.: Who are the crowdworkers? shifting demographics in mechanical turk, CHI EA’10, pp. 2863-2872, ACM(2010)

[Takagi 08] Takagi, H., Kawanaka, S., Kobayashi, M., Itoh, T. and Asakawa, C.: Social accessibility: Achieving accessibility through collaborative metadata authoring, Proc. ASSETS’08, pp. 193-200, ACM(2008)

[高木 11] 高木啓伸:全文テキスト化の技術,現代の図書館,Vol. 49, No. 2, pp. 104-116(2011)

[von Ahn 04] von Ahn, L. and Dabbish, L.: Labeling images with a computer game, Proc. CHI’04, pp. 319-326, ACM(2004)

2013年 11 月 6 日 受理

著 者 紹 介

高木 啓伸 1999年東京大学理学系研究科情報科学専攻博士課 程単位取得退学後,2000 年学位取得.1999 年から 日本アイ・ビー・エム株式会社東京基礎研究所勤務. 現在シニア・テクニカル・スタッフ・メンバー,ア クセシビリティ研究担当.アクセシビリティ,クラ ウドソーシングの研究に従事.博士(理学). 井床 利生 2004年東京大学大学院情報理工学系研究科修士課 程修了.同年,日本アイ・ビー・エム株式会社入社. 数理最適化アルゴリズムおよび書籍アクセシビリ ティの研究に従事. 齋藤  新 2001年東京大学大学院理学系研究科修士課程修了. 同年,日本アイ・ビー・エム株式会社入社.Web ア クセシビリティおよびクラウドソーシングに関する 研究に従事. 小林 正朋 2008年東京大学大学院情報理工学系研究科博士課 程修了.同年,日本アイ・ビー・エム株式会社入社. Webアクセシビリティおよび高齢者 ICT に関する 研究に従事.博士(情報理工学). *19 http://sc.cyber.t.u-tokyo.ac.jp

参照

関連したドキュメント

ㅡ故障の内容によりまして、弊社の都合により「一部代替部品を使わ

私たちは上記のようなニーズを受け、平成 23 年に京都で摂食障害者を支援する NPO 団 体「 SEED

私たちは上記のようなニーズを受け、平成 23 年に京都で摂食障害者を支援する任意団 体「 SEED

彼らの九十パーセントが日本で生まれ育った二世三世であるということである︒このように長期間にわたって外国に

いてもらう権利﹂に関するものである︒また︑多数意見は本件の争点を歪曲した︒というのは︑第一に︑多数意見は

遮音壁の色については工夫する余地 があると思うが、一般的な工業製品

 今日のセミナーは、人生の最終ステージまで芸術の力 でイキイキと生き抜くことができる社会をどのようにつ

兵庫県 篠山市 NPO 法人 いぬいふくし村 障害福祉サービス事業者であるものの、障害のある方と市民とが共生するまちづくりの推進及び社会教