講義アーカイブシステムにおけるホワイトボード
領域の鮮明化
Whiteboard Sharpening for Lecture Archiving System
長谷川
忍
1,2小林
弘彬
2Shinobu Hasegawa
1,2and Hiroaki Kobayashi
21
北陸先端科学技術大学院大学
情報社会基盤研究センター
1Research Center for Advanced Computing Infrastructure, JAIST
2
北陸先端科学技術大学院大学
情報科学研究科
2School of Information Science, JAIST
Abstract: The purpose of this research is to propose a methodology to sharpen whiteboard images in a
lecture archiving system which records face-to-face lectures by a fixed ceiling camera. In the lecture archiving system, it is not so easy to read the whiteboard contents, which has important role for students in understanding the lecture, due to deficiency of the camera resolution, angle of the camera, lighting environment in the lecture rooms, overlapping of instructors, etc. We mainly focus on software processing to improve the quality of the whiteboard images in the lecture archive.
1. はじめに
情報量が爆発的に増大しているグローバルな現代 社会においては,知識そのものに加えて,知識の伝 達速度も求められており,インターネットで扱うこ とができるデータ量が急速に増大したことと相まっ て,時間や空間を限定せずに「いつでもどこでも」 学習を行える環境が身近なものとなりつつある. 本稿ではこうした学習環境の中でも特に,講義室 で行われる対面講義の映像・音声をデジタルデータ として収録し,体系的に管理・配信するものを講義 アーカイブと呼ぶ.筆者らが所属する北陸先端大学 院大学情報科学研究科では 2006 年度よりほぼ全て の対面講義を収録し,学生による対面講義の予復習 を支援する補完的な学習環境を提供してきた.これ らの収録・配信作業の大部分は自動化されており, 少ない運用コストにも関わらず,学生の講義の振り 返りに活用されていることが示されている[1].しか しながら,講義室の後方上部に固定された1 台のカ メラで撮影されているため,カメラの解像度,角度, ピント,講義室の照明環境,講師の重なり等といっ た様々な要因で,ホワイトボードの内容が読みづら いという課題が指摘されている. 本研究の目的は,講義アーカイブにおけるホワイ トボード領域の読みにくさを改善する手法を提案す ることである.こうした課題を解決するアプローチ としては,カメラワークを自動化する方法[2]や複数 台のカメラを用いて板書を保存する方法[3],講師が カメラワークを行える簡易な操作パネルを提供する 方法[4],特殊なペンやスクリーンを利用する方法[5] などが提案されているが,これらを適用するために はハードウェアの追加が必要となり,運用コストも 向上することが見込まれる. そこで本研究では,ソフトウェア処理によるホワ イトボード領域の鮮明化を目指す.嶌田らはホワイ トボードの領域の判定や傾き補正に加えて,ホワイ トボード中の文章量が多い部分を抽出する手法を提 案している[6].また,筆者らの先行研究では,アー カイブ画面上のオプティカルフローが最大値をとる 座標を取得することで講師の位置を推定し,その周 辺のホワイトボードの画像をリッピングする手法を 提案している[7]. しかしながら,オリジナルのアーカイブにおける ホワイトボード領域の鮮明さが不十分である場合に は,これらの手法は有効であるとは言えない.そこ で本研究では,ホワイトボード領域の解像感を向上 させる手法として,ディープラーニングによる超解 像化手法や複数フレームを利用した超解像化手法 [8]を適用した鮮明化を試みる.また,これらの手法 を講義アーカイブのデータに実際に適用する上で必 要な前処理について検討する. 人工知能学会研究会資料 SIG-ALST-B505-07 ― 30 ―2. 講義アーカイブシステム
2.1 講義アーカイブの実現手法
講義アーカイブの実現手法については,図1 に示 す通りいくつかのレベルが想定される[9].最もシン プルな形式は,90 分の対面講義を教室後方からビデ オカメラで収録し,ほぼそのままの形で配信する手 法である.一方,専用のスタジオ等で収録を行い, プレゼンテーション資料などを同期した上で,必要 があれば詳細な編集を行うアプローチもしばしば行 われている.後者については対外配信や対面講義の 代替として効果が期待できる反面,収録・編集にか かる費用面・作業面のコストや収録のための制約が 大きくなる傾向がある. 図1. 講義アーカイブの実現手法2.2 講義アーカイブシステムの構成
筆者らは,品質とコストのバランスを考慮して, 図1 の中央のレベルに相当する大規模運用可能な講 義アーカイブシステムを運用している[10].本節で はそのうち講義アーカイブの映像品質に関わる部分 を中心に構成を述べる. 図2 に示すように,収録対象の講義室には,アー カイブ収録サブシステムとして,フルHD 対応ビデ オカメラであるPanasonic AW-HE70HW9 が天井に設 置されている.一方,エンコード装置としては,フ ルHD 品質のエンコードが可能な Photron PowerRec SS が導入されている.全てのエンコード機器はサー バ室に集約されており,各講義室の映像・音声はPC 画面とミキシングを行って講義室とサーバ室の間を 接続する光ファイバで転送し,マトリックススイッ チャに収容される構成となっている. アーカイブ収録サブシステムで収録されたオリジ ナルの講義アーカイブは,1080p,4Mbps の高解像度 コンテンツとしてそのまま配信するだけでなく,640 ×360,512kbps の低解像度コンテンツに変換される. また,高解像度コンテンツから一定時間(5 分間隔)で あらかじめ指定した領域における画面変化量を判定 し,情報量の最も多い場面を代表ホワイトボード画 像として自動抽出を行っている.これにより,図 3 に示すように,画面上部に代表ホワイトボード画像, 画面左下に低解像度動画,画面右下に動画掲示板を 生成することで,ホワイトボード領域を振り返りや すい構成となっている. 図2. 講義アーカイブシステムの構成2.3 ホワイトボード品質の課題と要因
講義アーカイブシステムの満足度に関しては,継 続してアンケート調査を行っているが,ホワイトボ ードの読みやすさに関する項目は,他の項目と比較 しても特に悪い結果となっている[1].この要因には 様々なものが挙げられる.まず,天井に固定された カメラの位置は,他の講義室内の機器の設置位置と の制約により中央からずれていることが多く,また, 天井近くから見下ろす形になっているため,映像に 傾きが発生する.また,フルHD の解像度であって も,講義室前面一杯に広がるホワイトボードに対し ては解像度が不足しており,添字などの細かい文字 を読み取ることは困難である.さらに,カメラのホ ワイトバランスやフォーカスが自動設定になってい るため,外光やプロジェクタ光とホワイトボード領 域の照度の違いで露出オーバー/アンダーになるこ とや,教員にピントが合うため,教員の立つ位置に よってホワイトボードがピンボケするといった問題 も見られる.また,講師がホワイトボードの前面に 立つことで,ホワイトボードの内容と重なって読み 取れないといったことも起きている. ― 31 ―3. 超解像化技術の適用
3.1 CNN による超解像化
Chao らは 3 層の CNN(Convolutional NeuralNet)を
利用して,1 枚の画像から超解像化を行う手法を提 案している[11].本手法は CNN への入力として低画 質化した画像を,出力としてオリジナルの画像を適 用することで,画像のシャープネスの向上やノイズ リダクションなどの補正ルールを学習することがで きる. 予備実験として,図4 に本手法をオープンソース として実装した waifu2x [12]を適用して 2 倍に拡大 した結果を示す.画像を拡大したことによるブロッ クノイズはやや低減されているが,精細さについて は大きな向上は見られなかった.今回はホワイトボ ード画像に特化した学習を行っていないため,そう した学習データを準備した際の効果については検討 の余地があるが,オリジナルのデータが既に精細感 がない本研究のケースではやや適用が難しいと考え られる. 図4 CNN による超解像化の例
3.2 複数フレームを利用した超解像化
動画データにはフレーム毎に微妙に異なる情報が 含まれており,あるフレームに含まれていない情報 が他のフレームに含まれている場合がある.このた め,複数フレームを利用してサンプリング時に失わ れた情報を復元することで画像を高精細化すること が可能となる[13].図 5 は講義アーカイブから 2 つ のフレームの差分を表示したものである.講師は講 義中に動いているため,その周辺の差分が強く表示 されているが,この間に実際には変化のなかったホ ワイトボード領域でも文字の周辺に差分が見られる. 図3. 動画掲示板のインタフェース ― 32 ―図5. 講義アーカイブのフレーム間差分 Wode は,スマートフォンのカメラで撮影したホワ イ ト ボ ー ド 領 域 に 対 し ,OpenCV に 実 装 さ れ た SuperResolution クラス[14]を適用することの有効性 を示しており,本研究でも一定の効果が期待できる.
3.3 超解像化のための前処理
複数フレームを利用した超解像化の手法は講義ア ーカイブにおけるホワイトボード領域の鮮明化に効 果があると考えられるが,実際に適用する上では適 切な前処理を行う必要がある. 本研究では,講義アーカイブ全体を鮮明化するの ではなく,図3 のインタフェースに示すように,特 定区間で情報量の多い場面を代表ホワイトボード画 像として取り出し,その中で鮮明化することを目指 している.しかしながら,講義中には講師が教室前 方を左右に移動するため,複数フレーム内で講師が 動いている状態は望ましくない.そこで,ホワイト ボード領域を分割して,それぞれの領域でホワイト ボードの情報量が同じで講師が画面内に含まれない ようなフレームを複数抽出し,そのフレーム群を利 用して処理を行う必要がある.本研究では,先行研 究でも用いたオプティカルフローによる講師位置の 推定[7]と,ホワイトボード領域の情報量の判定に基 づき,講師のいない代表ホワイトボード画像周辺の フレーム群を入力動画として利用する.また,嶌田 らの傾き補正の手法[6]や,ホワイトバランスを変更 したフレームを挿入することで,画像の歪みや露出 不良にロバストな処理を行うことを目指す.4. おわりに
本稿では,講義アーカイブにおける運用コストを 増大することなく,ホワイトボード領域の視認性を 向上する試みとして,2 つの超解像化手法の適用に ついて検討した.講義アーカイブでは講義の様子が 動画として保存されているため,複数フレームを利 用した超解像化手法が適していると考えられるが, 特定の区間を代表するホワイトボード領域周辺の適 切なフレームを抽出するアルゴリズムを検討する必 要がある.今後は,生成されたホワイトボード画像 の品質を,講義アーカイブシステムの利用者による 再現率や主観評価によって確認する予定である.参考文献
[1] 吉良,長谷川:大学院生の補完的学習環境としての講 義アーカイブシステムの運用と分析, 教育システム 情報学会誌,Vol.32, No.1, pp.98-110 (2015). [2] 大西,村上,福永:状況理解と映像評価に基づく講義 の知的自動撮影,電子情報通信学会論文誌,D-II, Vol.J85-D-II,No.4,pp.594-603,(2002). [3] 市村,福井,井上,松下:Web 学習用コンテンツを自 動作成する板書講義収録システム,情報処理学会誌, Vol.47,No.10,pp.2938-2946,(2006). [4] 井上,品田,市村,星:板書の意識的な強調を利用し た復習用コンテンツ自動生成システム,情報処理学 会誌,Vol.53,No.1,pp.49-60,(2012). [5] 矢田,鶴岡,吉川,篠木:遠隔授業映像撮影のための カメラ映像と板書画像を併用したカメラ視野の決定 法,電子情報通信学会技術研究報告 113(482), pp.89-94, (2014). [6] 嶌田,東野,今野,三石,早川,静谷:学習支援や授 業振り返りのための板書レクチャーの簡易コンテン ツ 化 , 電 子 情 報 通 信 学 会 技 術 研 究 報 告 111(478), pp.217-222, (2012). [7] 澤田,長谷川:講義アーカイブを対象とした編集プロ グラムの開発,2011 年春 JSiSE 学生研究発表会論文 集,pp.122-123, (2011).[8] N. Wode: Whiteboard Scanning Using Super-Resolution, Dickinson College Honors Theses. Paper 221, (2016). http://scholar.dickinson.edu/student_honors/221 [9] 長谷川,辻,但馬,宮下,安藤:講義アーカイブを活 用したコミュニティ動画掲示板システムの構築,電 子情報通信学会技術研究報告,ET2010-11, pp.25-30, (2010). [10] 長谷川:3.1 遠隔学習システム,教育工学選書 II e ラーニング/e テスティング,ミネルバ書房,(2016). [11] C. Dong, C. C. Loy, K. He, X. Tang: Learning a Deep Convolutional Network for Image Super-Resolution, in Proceedings of European Conference on Computer Vision (ECCV), 2014.
[12] waifu2x http://waifu2x.udp.jp/
[13] 木村:動画を高精細化する複数フレーム超解像度技 術,東芝レビュー 71(4), pp.62-63, (2011).
[14] OpenCV: Super Resolution,
http://docs.opencv.org/2.4/modules/superres/doc/super_re solution.html