41 ヒューマンコンピュテーションとクラウドソーシングクラウドアクセシビリティクラウドソーシングによる障害者支援 Accessibility + Crowdsourcing = Crowd Accessibility 高木啓伸 Hironobu Takagi 日本アイビーエム ( 株 ) 東

(1)

1.　は　じ　め　に

人が学び，働き，日常生活を送るうえで視覚や聴覚は重要な役割を果たしている．黒板を読むことのできない学校生活や商品を見ることのできない買い物，相手の声が全く聞こえない会議を想像できるだろうか？　視覚や聴覚に障害をもつ人々はまさにそうした環境の中で工夫しながら日々を過ごしている．この困難な状況を支援する技術が障害者支援技術（Assistive Technology）である．例えばメガネ型カメラデバイスを用いて目の前にある文字や商品を撮影・認識して読み上げることができれば視覚障害者にとって非常に有用であることは容易に想像できる．周囲の音声を録音・認識して文字として表示すれば聴覚障害者が会議に参加することもできるだろう．障害者支援技術はまさにそうした「夢」の実現へ向け進歩してきた．課題はその精度にある．光学文字認識（OCR: Optical Character Recognition）をはじめ，物体認識，音声認識といった認識技術は数十年にわたり徐々に精度を向上させてきた．しかし，撮影品質や認識対象の質と量，録音音声の音質や発話内容によってまだまだ精度に大きなばらつきがあり，現実の障害者のニーズを満たすレベルには達していないのが現状である．そこで生まれてきたのが障害者支援にクラウドソーシングを用いようとするアプローチだ．著者らはこれを「クラウドアクセシビリティ（Crowd Accessibility）」と呼んでいる．視覚障害者が商店の中で撮影したラベルの文字を人の手で認識すれば，合成音声で読み上げることが可能になる．音声認識の誤りをインターネット越しにリアルタイムで修正できれば，会議に参加する聴覚障害者の強力なサポートになる．クラウドアクセシビリティはまさに「夢のサービスを現実にする」手段だといえよう．クラウドソーシングは時として「安く人を働かせるための仕組み」と誤解されることもあるが，ここでクラウドソーシングが実現しようとしているのは，人の知とコンピュータの知を融合し，視覚や聴覚に障害をもつ人々を支援するための新たなサービス群なのである．本稿では，まずコンピュータの出現により大きく進化した障害者支援技術の歴史を概観する．次に現在各国で試行されている新たなサービス群について，視覚代行サービス，書籍のディジタル化，動画への字幕付与，ゲーミフィケーションといった観点から紹介する．最後に，日本におけるクラウドソーシングの担い手としての高齢者の可能性について述べ，今後の展望を考察する．

2.　イノベーションと障害者ニーズ

障害者支援技術はその名のとおり障害者という特別なユーザを対象にした技術である．しかしその強いニーズは多くの歴史的な発明のきっかけとなってきた．古い例として，電話はグラハム・ベルが聴覚障害者用のコミュニケーション器具開発過程で発明したと伝えられている [Pasachoff 11]．また，文字入力キーボードの起源の一つに上肢障害者用の文字入力機器があるともいわれている．本稿と関連の深い各種認識技術もその源流に支援「ヒューマンコンピュテーションとクラウドソーシング」

クラウドアクセシビリティ

─クラウドソーシングによる障害者支援─

Accessibility + Crowdsourcing = Crowd Accessibility

高木　啓伸

日本アイ・ビー・エム（株）東京基礎研究所

Hironobu Takagi IBM Research - Tokyo, IBM Japan, Ltd.

[email protected], http://researcher.ibm.com/person/jp-TAKAGIH

井床　利生

（同　　上）

Toshinari Itoko [email protected], http://researcher.ibm.com/person/jp-ITOKO

齋藤　　新

（同　　上）

Shin Saito [email protected], http://researcher.ibm.com/person/jp-SHINSA

小林　正朋

（同　　上）

Masatomo Kobayashi [email protected], http://researcher.ibm.com/person/jp-MSTM

Keywords:

crowdsourcing, accessibility, assistive technologies, object recognition, text digitization, video captioning.

(2)

技術としての側面をもっているものが多い．OCR 技術の歴史をひもとけば，最初の実用機器として視覚障害者のための読書器「Kurzweil Reading Machine」にたどり着く．CCD スキャナ上に置いた文書や書籍といった紙面の文字を OCR で自動認識し合成音声で読み上げることのできる世界初の製品である．1974 年に全米視覚障害者連盟とともに発表されたこの装置は評判を呼び， OCR技術のみならずスキャン技術や音声合成技術にとっても大きなマイルストーンとなった．また，音声認識技術も当初から聴覚障害者の支援を主な用途の一つに数えていた．最近のスマートフォンに搭載されている音声対話システムの開発過程でも障害者ニーズが参照されているといわれている．さらには，テレビの字幕システムももともとは聴覚障害者のために開発された技術だ． 1970年代に登場した後，移民の多いアメリカにおいて英語初級者にとっての有用性が高く評価され広く普及したのである．現在，音声認識技術は字幕作成現場においても重要な役割を担っている．ほかにも，視覚障害者のための自動運転車など，障害者ニーズをベースにした認識技術のイノベーションには枚挙に暇がない．クラウドアクセシビリティという観点から源流をたどれば，そのアイディアは「クラウドソーシング」という言葉が登場するはるか以前から存在していた＊1_．1988 年に日本で開始された「てんやく広場」は最初期の例の一つである＊2_{．点字は 6 個の点の凹凸により文字を表現} する表記法であり，26_{＝ 64 通りの文字しか表現できな} い．そのため日本語を表記するには特殊な記法が必要となる．その変換作業が「点訳」である．多数の例外を含む変換ルールに習熟した点訳者は常時不足しており，また紙面に物理的な穴をうがつ点字文書は修正をはじめとした編集が非常に困難である．1980 年代半ばにパーソナルコンピュータを用いて点字を編集する点字ワープロが開発されたことにより必要スキルの軽減と編集効率の向上が実現されたが，一方，各地の点訳作業者が同じ書籍を重複して点訳する非効率が顕著になってきた．そこで 1988 年に誕生したのが，点字ワープロで作成したファイルをネットワークで共有する「てんやく広場」である．これにより，一冊の書籍を分割し多くのボランティアによって点訳作業を同時並行することも可能になった．大規模な辞書などの点訳も容易になり，点字書籍が大きく増加する契機となったのである．米国ではさらに大規模な取組みが進んでいる．前述の Kurzweil Reading Machineの成功後，1980 年代には

OCR製品を扱う企業が数多く誕生した．そのうちの一社であるアーケンストーン社が 1990 年代にディジタルテキストを共有するサービスを開始した．このサービスは 2000 年に「Bookshare」として独立し，現在に至るまで活発に活動している＊3_{．ベストセラー書籍が出版さ} れる際には発売直後から数多くのボランティアやユーザがディジタル化に携わり，出版当日にはディジタル化が完了するほどである．2007 年には米国教育省から 3,200 万ドルの資金援助を受け，教育用書籍のディジタル化サービスも提供している．障害者支援分野と並行して，書籍ディジタル化のクラウドソーシングは歴史的書籍の保存や検索を可能にするための全文テキスト化分野においても発展してきた＊4_{．一例として，オーストラリア国立図書館による新} 聞ディジタル化プロジェクト＊5_{，EU における IMPACT} プロジェクト＊6_{などがある．この分野で近年最もインパ} クトがあったイノベーションは reCAPTCHA＊7_の登場であろう．reCAPTCHA は認証システムの一部として動作する．CAPTCHA は人がアクセスしていることを確認するために OCR による自動認識の難しいゆがんだ文字列を人が目で見て入力することを要求するシステムだが，reCAPTCHA は同時に「ディジタル化対象文書の中で OCR の困難な単語」を表示することでユーザを「気付かないうちに」ディジタル化作業に参加させてしまう．この発明によりアルファベット利用言語のディジタル化が大きく前進したといわれている． 1990年代後半になると，Web の急速な普及により障害者の Web アクセスを保障する「Web アクセシビリティ」が書籍アクセシビリティと並ぶ重要課題として認知されるようになった．その議論の中から 1998 年に提案されたアイディアが ALT-server＊8_{である．ある Web} ページ上に画像の代替テキスト（alt 属性）が存在していない場合に「誰か」が付与できる仕組みを提供するとともに，それを共用データベースに蓄積し一度付与した代替テキストを誰でも再利用できるようにするという提案であった．このアイディアはその後いくつかの方法で実装されることになる．ワシントン大学で開発された WebInSight は OCR を用いて文字を含む画像の代替テキストを自動生成する機能をもち，誰でもその認識結果を修正できることができた [Bigham 06]．CMU で開発された ESP Game とその後継である Google Image

Labelerは画像へのテキスト付与作業のゲーミフィケーションを試みた [von Ahn 04]．2008 年に著者らのグループが公開したソーシャルアクセシビリティプロジェクト [Takagi 08]ではインタラクティブな編集ツールを提供し，代替テキストに加え見出しテキストの付与や読上げ順序調整のクラウドソーシングを実現した．＊1 クラウドアクセシビリティ関連技術のサーベイとしては， [Bigham 11]を参照．＊2 現在のサピエ（http://www.sapie.or.jp/）の前身．＊3 http://www.bookshare.org/ ＊4 全文テキスト化関連技術のサーベイとしては，[高木 11] を参照．＊5 http://trove.nla.gov.au/ ＊6 http://www.impact-project.eu/ ＊7 http://www.google.com/recaptcha ＊8 http://www.w3.org/WAI/altserv.htm

(3)

次章では，近年主流になりつつある「人の知とコンピュータの知の融合」，すなわち自動認識技術との連携に主眼を置くクラウドアクセシビリティサービスについて，具体例をあげてご紹介したい．

3.　クラウドアクセシビリティ技術例

3･1　視覚代行サービス視覚障害者が「今，目の前にあるこの商品は何か」，「この広場に何があるか」といった疑問を日常生活においてもつことは想像に難くない．そこで近年活発になってきたのがスマートフォンを活用した視覚代行サービスである．例えば IQ Engines 社が提供していた oMoby は写真画像からの物体認識とクラウドソーシングを組み合わせたサービスだ．専用アプリで何かの写真を撮影すると自動的に画像内のオブジェクトが認識され，読み上げられる．すでに登録されている企業のロゴなどはこの段階で認識される確率が高い．自動認識可能な対象物が見つからなかった場合はクラウドソーシングにより認識されることになる．IQ Engines 社ではトレーニングを受けた作業者が常時待機しており数分後には説明テキストが送られてくる．人手によって作成されたテキストは画像認識エンジンの学習データとしても活用され，徐々にサービスの自動化が図られるという仕組みである．有用性が明確であり今後の発展も期待されるサービスではあるが，いくつかの大きな課題がある．一つ目は省力化の技術的な難しさである．対象物に制限のない物体認識は現在の技術レベルでは実現困難だ．著者らのテストにおいても自動認識可能なケースは「著名な飲料のラベルが明らかに撮影されている場合」などに限られた．持続可能なサービスの実現には認識精度向上によるコスト低減が不可欠であり，人力での認識結果をより有効な学習につなげる技術フレームワークが必要になる．今後の研究開発が期待される分野である．もう一つはビジネスモデルの問題である．1 枚の画像の説明を得るために，果たしてユーザはいくら支払うであろうか？　積極的に利用するユーザは，果たして何人いるだろうか？　ビジネスモデルは障害者支援サービスが常に直面する課題である＊9_．

拡張現実（AR: Augmented Reality）などの隣接領域技術と連携しながら視覚代行サービスを実証するための努力もさまざまな形で開始されつつある．AR は広告分野などにおいて近年盛んに実サービス化されている技術である．視覚を代行するという夢のサービスを現実社会の中で持続可能なものにするための実験がいよいよ始まった感がある． 3･2　書籍のディジタル化前章で紹介したように書籍ディジタル化には長い歴史があり，数多くのシステムが開発されてきた．しかし日本においては，日本語の言語的な豊かさに起因する独特の困難がある．前述の Bookshare では OCR による認識後に英文スペルチェックをかけるという手順が用いられているが，26 文字のアルファベットで表現され単語間がスペースで区切られる言語では，これだけでも一定品質のディジタル化が可能である．一方，日本語には常用漢字 2 136 字，旧字・異体字も含めれば約 10 000 字という膨大な文字種があり OCR 精度の向上を困難にしている．自動認識精度の品質は人手での校正コストとして跳ね返ってくる．また，縦書き・横書きの混在やルビをはじめとする独特の記法なども校正コストを増加させる原因となる．そこで著者らは日本語に最適化された全文テキスト化クラウドソーシングシステムを開発した．このシステムは書籍校正作業をいくつかのステップに分割しそれぞれに簡便なクラウドソーシングインタフェースを提供することで作業効率向上を図るものであり，2013 年 10 月より（福）日本点字図書館が実施している実証実験＊10_でも活用されている．この仕組みを図 1 に示す．最も人手を要する OCR 結果テキストの校正作業がクラウドソーシングされるため，専属スタッフは OCR 処理や見出し編集作業といった専用ツールや専門スキルを必要とする作業に注力できるようになる．著者らのシステムは，日本語 OCR における典型的な誤認識が（a）同一文字の誤り，（b）ルビ箇所の誤り，（c）複数文字にわたる誤りの 3 種に分類できる点に着目し，各誤認識の修正に対応した三つの作業画面（図 2（a）～（c））を提供する．（a）一文字校正は IMPACT プロジェクトの成果である CONCERT [Neudecker 10]のインタフェースを利用しており，ある文字として認識された文字を一覧表示することで通読では見落としやすい間違いの一括修正を可能にする．（b）ルビ校正は文字サイズの問題で OCR が誤＊9 IQ Engines 社は米国政府から資金援助を受けサービス提供していたが，2013 年 8 月に米国 Yahoo! 社により買収されることが発表された．図 1 日本点字図書館による書籍ディジタル化実証実験の概要（DAISY は障害者向けディジタル図書の国際標準規格）＊10 http://www.nittento.or.jp/press/pr131015_ tdaisy.html

(4)

認識しやすいルビ文字の確認・修正に特化した画面である．（c）文字列校正では「の子だ」を「の，丁だ」と誤認識したケースなど，前後の文字をまとめて編集すべき箇所の確認・修正を行う．これらのクラウドソーシング校正を経たテキストは一定の読書体験を提供できるレベルには達しているものの，トレーニングを受けたベテラン校正者の精度には及ばず，効率と精度の一層の向上が求められる．一つのアプローチとして，IQ Engines 社が画像認識において行ったように，校正結果を OCR エンジンの学習データとすることで認識精度向上の可能性がある．しかし，ここで現実には信頼性の高い学習データの選別が大きな課題となる．著者らの実験では，すべての校正結果を学習データとした結果，逆に認識精度が下がってしまうケースもあった．原因を探ると，誤った校正結果や，画像だけでは本来判別不可能なはずの文字を人が文脈から推測して校正した結果を学習してしまったことが判明した．法制化や DRM の問題，新フォーマット EPUB3 の登場といった話題も含め，電子書籍時代の書籍アクセシビリティを巡ってはまだまだ紆余曲折が予想される．誰もが読みたい書籍を読める時代を目指し，さまざまな側面から技術開発が進むことを期待している． 3･3　動画への字幕付与とゲーミフィケーションインターネット上で爆発的普及を見せた動画コンテンツは教育現場や企業組織の中でもその存在感を増している．Kahn Academy＊11_{が草分けとなって数千～数万} 規模の教育動画を無償公開する MOOC（Massive Open Online Course）の動きが活性化しており，また企業内においては遠隔会議や会議録画コンテンツが盛んに活用され始めつつある．しかし，聴覚障害者の動画アクセシビリティはこれまでテレビ番組や映画を中心に考慮されてきたため，インターネット動画のアクセシビリティは極めて遅れた状況にある [Kobayashi 12]．インターネット動画の特徴はその多様性，すなわち「ロングテール」のテール部分にあろう．ここでは，ごく少数の人にとって重要な大量のコンテンツのアクセシビリティをいかに効率良く向上させるかが問われる．

長妻らが提案した Collaborative Caption Editing System（CCES）[Nagatsuma 12] は，コンテンツを 10 秒程度のトラックに細かく分割することにより多人数での字幕作成を可能にするシステムである．図 3 に示すとおり，各作業者には連続したトラックを最大 10 個程度まとめて分配する．キーボードフォーカスのあるトラックの音声と映像はループ再生されており，それを繰り返し視聴しながら字幕を書き起こすことができる．各作業者によって入力された作業結果はまとめられ，最終的な調整を加えたうえで字幕の完成となる．著者らのグループで CCES を使い英語動画の字幕を作成していたところ，英語リスニングの良いトレーニングになるという声がメンバの中から上がってきた．そこから発想したのが，字幕作成をゲーム化し，外国語を学習しながら字幕を作成して動画のアクセシビリティを向上させるという一石二鳥のアイディアだ．CapCap はそのアイディアを実装したシステムである（図 4）．このシステムは英語を母国語としないプレーヤ間のスキルに大きな差があることを踏まえて設計されている．まず，参加インセンティブの一つとして参加者ランキングを提示するが，ここで個人ランキングではなくチーム制をとる．これは「集団への貢献による動機付け」というソーシャ図 3 字幕作成画面．（a）字幕作成対象の動画が繰り返し再生される．（b）字幕入力欄は 1 トラック 1 行で表示される図 4　CapCap ラウンドの画面．（a）字幕作成対象の動画が繰り返し再生される．（b）字幕テキスト入力ボックス．TYPE ラウンドではここは空白であり，FIX ラウンドでは修正対象のテキストがあらかじめ入力されている．（c）ラウンド数や得点，残り時間が表示される＊11 http://www.khanacademy.org/ 図 2　3 種の校正クラウドソーシングインタフェース

(5)

ルゲームでよく見られる手法でもある．また，1 トラック分の字幕作成を基本的に一人の作業者が担う CCES と異なり，複数の参加者が一つのトラックに貢献する．その仕組みは以下のとおりである．プレーヤがゲームに参加すると対戦相手がランダムに決められる（ただし，この相手が画面に表示されることはない）．各ラウンドで二人のプレーヤが同じトラックに字幕を付けるが，一方のプレーヤは一から字幕を書き起こす「TYPE」ラウンドを，他方のプレーヤは以前のゲームで他のプレーヤが書き起こした字幕を修正する「FIX」ラウンドを行う．両者の入力結果が一致すればするほど各プレーヤに高得点が与えられるルールである．一致度は各入力を単語のシーケンスとみなしたペアワイズ文字列整列によって判定する．各トラックの字幕作成は 1 回のラウンドだけで完了するわけではなく，TYPE ラウンドと FIX ラウンドの繰返しを通じ複数のプレーヤによって順次作業される．トラックが初めて FIX ラウンドでプレイされるときには自動音声認識の結果が入力として与えられ，そうでないときには直前の TYPE ラウンドと FIX ラウンドの結果を文字列整列によってマージした結果が与えられる．この繰返しにより字幕の品質が高められるのである．FIX ラウンドで一定回数連続して修正がなされない場合にそのトラックは完了したとみなされ，これまでの作業結果をマージしたものを最終的な字幕とする．このマージはすべての TYPE および FIX ラウンドの結果を対象とし， A＊_{探索アルゴリズムを用いた単語列の多重整列}

（Multiple Sequence Alignment: MSA [Naim 13]）によって行う．著者らが行った実験では，完了とみなされた 60 トラックにおける WER（Word Error Rate）は 4.0％であり，音声認識結果の 8.4％と比べ大幅な向上が見られた．また，全トラック間の WER の分散も大きく減少した．これは，参加者のほとんどがネイティブでないにもかかわらず安定して高い精度が得られることを示している．さらに，ボーナスラウンドとして「SPEAK」ラウンドも設けた．ここではプレーヤは字幕として表示すべき内容をマイクに向かって話す．音声は音声認識エンジンによりテキストに変換される．二人のプレーヤの入力に対しマッチングを行うのは他のラウンドと同様である．しかし実際にプレイしてみると，音声認識エンジンのもつ音響モデルがネイティブの発音に基づくため日本人の発音ではなかなか正しく認識されないことがわかり，良い練習になる．先日，クラウドソーシングによって多言語字幕作成を行う動画配信サービス Viki＊12_{が楽天に買収されたこ} とが話題になったが，クラウドソーシング型の字幕・書き起こしサービスとしては Amara＊13_{や PodCastle}＊14 などが有名である．また，Duolingo＊15_{は第二言語学習} を主目的とするプラットフォームだが，追加機能として動画の字幕作成に貢献することができる．学習の動機付けとしてスキルや進捗の可視化といったゲーミフィケーションの仕組みを採用している．スマートフォン版インタフェースも提供されており，隙間時間を使って貢献するというクラウドソーシングのコンセプトと親和性が高いと考えられる．究極的には，動画中の音声情報を 100％認識可能であればクラウドソーシングによって認識誤りを正す必要はない．しかし，言い回しや表記の調整，非言語音声の表現などについてはいずれにしろ人の手が必要になる．今後も音声認識技術の進歩と歩調を合わせ，字幕作成のためのさらなる技術開発が進められるに違いない．

4.　日本におけるタスク担い手の課題

クラウドアクセシビリティを現実世界の中で持続可能なサービスとして展開するために避けて通れないのが，作業者確保の課題である．国際的なクラウドソーシングサービスの中では Amazon Mechanical Turk（MTurk）＊16

が広く利用されているが，その作業者は 9 割が米国人とインド人で占められており日本人は非常に少ない [Ross 10]．日本においてサービスを展開するためには日本語を解する新たな作業者層の発掘が必要である．また，言語だけでなく文化の問題も重要だ．例えば，著者らが oMobyで「煎餅」の写真をリクエストしたところ「Food」とだけ説明された経験からもその必要性は明らかである．最近，日本国内でもクラウドソーシングの担い手を増やすための努力が活発になっている．ココナラ＊17_や Yahoo!クラウドソーシング＊18_{などは特にマイクロタス} クに焦点を当ててサービスを展開しており，クラウドアクセシビリティと親和性が高い．将来的にはこれらを活用したクラウドアクセシビリティサービスが登場するかもしれない．著者らはクラウドアクセシビリティの担い手としての高齢者層に注目している．日本の高齢者層は「高齢者の定義を（日本だけ）変更すべき」という議論が実際に起こるほど知力・体力ともに高いレベルにある．金銭的・時間的に余裕がある人も多い．障害者支援に興味をもつ層も厚く，1 日のうちわずかな時間で貢献できる仕組みが整えば多くの参加者が見込めるはずである．著者らがこのことに気付いたのは，前述のソーシャルアクセシビリティプロジェクトにおける最多貢献者が定年を控えた方であることが判明したときであった．彼は「（退職後に）手に入れる時間を使って社会的に意味のある活動をした＊15 http://www.duolingo.com/ ＊16 https://www.mturk.com/ ＊17 http://coconala.com/ ＊18 http://crowdsourcing.yahoo.co.jp/ ＊12 http://www.viki.com/ ＊13 http://www.amara.org/ ＊14 http://podcastle.jp/

(6)

い」という明確なモチベーションをもっていた．世界一の超高齢社会となっている日本には，このようなモチベーションをもつ高齢者が数多く存在している．著者らのグループでは，このような高齢者層の活力を生かす新たなサービスの実現を目指し，科学技術振興機構（JST）の支援のもと東京大学とともに「高齢者クラウド」という研究開発プロジェクトを進めている＊19_{．3･2 節で紹介} した日本点字図書館の実証実験はこのプロジェクトの一環として実施しているものだ．そのため作業者として高齢者を歓迎する仕組みになっている．担い手の確保はクラウドソーシングにおいて本質的課題である．米国では MTurkが安定的な作業者供給源となることでさまざまなクラウドソーシングサービスが発展してきた．日本においても高齢者をはじめとした担い手とタスクを結び付ける仕組みが発展していけばクラウドアクセシビリティへの取組みもさらに活発になるに違いない．

5.　ま　と　め

本稿ではクラウドソーシングを障害者支援に活用する「クラウドアクセシビリティ」について概説した．障害者支援分野では伝統的に人々の力を集める活動が数多く行われてきたこともあり，クラウドソーシングというアプローチが自然と受け入れられている．さらには，認識技術（コンピュータの知）とクラウド（人の知）の融合によって，視覚代行，書籍ディジタル化，字幕作成などのサービスを持続可能な形で実現できる可能性も見えてきた．日本におけるタスク担い手の発掘は大きな課題であるが，高齢者層をはじめとする「鉱脈」も存在している．人間の感覚を代行するという「夢」を達成するための重要技術として，クラウドアクセシビリティへの取組みがさらに活発になることを期待してやまない．2 章で述べたように障害者ニーズから生み出された技術の中には当初の予想を超え一般化したものも数多い．クラウドアクセシビリティこそがクラウドソーシングを世の中により広く普及させる先鋒になり得るという期待も，突飛なものではないのではないだろうか．謝　辞本稿に紹介した研究の一部は（独）科学技術振興機構（JST）の研究成果展開事業【戦略的イノベーション創出推進プログラム】（S-イノベ）の支援によって行われたものです．

◇　参　考　文　献　◇

[Bigham 06] Bigham, J. P., Kaminsky, R. S., Ladner, R. E., Danielsson, O. M. and Hempton, G. L.: WebInSight: Making

web images accessible, Proc. ASSETS’06, pp. 181-188, ACM （2006）

[Bigham 11] Bigham, J. P., Ladner, R. E. and Borodin, Y.: The design of human-powered access technology, Proc. ASSETS’11, pp. 3-10, ACM（2011）

[Kobayashi 12] Kobayashi, M., Takagi, H., Fukuda, K. and Nagatsuma, R.: Pilot deployment of HTML5 video descriptions,

CSUN（2012）

[Nagatsuma 12] Sobhi, A., Nagatsuma, R. and Saito, T.: Collaborative caption editing system - Enhancing the quality of a captioning and editing system, CSUN（2012）

[Naim 13] Naim, I., Gildea, D., Lasecki, W. and Bigham, J.: Text alignment for real-time crowd captioning, NAACL（2013） [Neudecker 10] Neudecker, C. and Tzadok, A.: User collaboration

for improving access to historical texts, LIBER Quarterly, Vol. 20, No. 1, pp. 119-128（2010）

[Pasachoff 11] Pasachoff, N., Gingerich, O., 近藤隆文：グラハム・ベル―声をつなぐ世界を結ぶ，オックスフォード科学の肖像，大月書店（2011）

[Ross 10] Ross, J., Irani, L., Silberman, M. S., Zaldivar, A. and Tomlinson, B.: Who are the crowdworkers? shifting demographics in mechanical turk, CHI EA’10, pp. 2863-2872, ACM（2010）

[Takagi 08] Takagi, H., Kawanaka, S., Kobayashi, M., Itoh, T. and Asakawa, C.: Social accessibility: Achieving accessibility through collaborative metadata authoring, Proc. ASSETS’08, pp. 193-200, ACM（2008）

[高木 11] 高木啓伸：全文テキスト化の技術，現代の図書館，Vol. 49, No. 2, pp. 104-116（2011）

[von Ahn 04] von Ahn, L. and Dabbish, L.: Labeling images with a computer game, Proc. CHI’04, pp. 319-326, ACM（2004）

2013年 11 月 6 日　受理

著　者　紹　介

高木　啓伸 1999年東京大学理学系研究科情報科学専攻博士課程単位取得退学後，2000 年学位取得．1999 年から日本アイ・ビー・エム株式会社東京基礎研究所勤務．現在シニア・テクニカル・スタッフ・メンバー，アクセシビリティ研究担当．アクセシビリティ，クラウドソーシングの研究に従事．博士（理学）．井床　利生 2004年東京大学大学院情報理工学系研究科修士課程修了．同年，日本アイ・ビー・エム株式会社入社．数理最適化アルゴリズムおよび書籍アクセシビリティの研究に従事．齋藤　　新 2001年東京大学大学院理学系研究科修士課程修了．同年，日本アイ・ビー・エム株式会社入社．Web アクセシビリティおよびクラウドソーシングに関する研究に従事．小林　正朋 2008年東京大学大学院情報理工学系研究科博士課程修了．同年，日本アイ・ビー・エム株式会社入社． Webアクセシビリティおよび高齢者 ICT に関する研究に従事．博士（情報理工学）．＊19 http://sc.cyber.t.u-tokyo.ac.jp

41 ヒューマンコンピュテーションとクラウドソーシング クラウドアクセシビリティ クラウドソーシングによる障害者支援 Accessibility + Crowdsourcing = Crowd Accessibility 高木啓伸 Hironobu Takagi 日本アイ ビー エム ( 株 ) 東

1. は じ め に

2. イノベーションと障害者ニーズ

クラウドアクセシビリティ

─クラウドソーシングによる障害者支援─

Accessibility + Crowdsourcing = Crowd Accessibility

高木 啓伸

井床 利生

齋藤 新

小林 正朋

Keywords:

3. クラウドアクセシビリティ技術例

4. 日本におけるタスク担い手の課題

5. ま と め

◇ 参 考 文 献 ◇

著 者 紹 介

41 ヒューマンコンピュテーションとクラウドソーシングクラウドアクセシビリティクラウドソーシングによる障害者支援 Accessibility + Crowdsourcing = Crowd Accessibility 高木啓伸 Hironobu Takagi 日本アイビーエム ( 株 ) 東

1.　は　じ　め　に

2.　イノベーションと障害者ニーズ

高木　啓伸

井床　利生

齋藤　　新

小林　正朋

3.　クラウドアクセシビリティ技術例

4.　日本におけるタスク担い手の課題

5.　ま　と　め

◇　参　考　文　献　◇

著　者　紹　介