interviewScribe ユーザーズガイド
目次
1.概要 3 2.聞き取りの準備 4 2.1. 音声ファイルを割り付ける 4 2.2. 再生操作 5 2.3. 音量、音質を調整する 6 2.4. フレーズを調整する 7 3.聞き取り操作 11 3.1. 対象フレーズを選択する 11 3.2. フレーズテキストの編集 12 3.3. システム 音声入力を使ってテキスト編集を行う 13 3.4. 話者を分類する 17 3.5. 聞き取り結果を得る 18 4.改訂履歴 202
1. 概要
interviewScribeは、テープ起こし作業を効率的に行うためのツールです。
• フレーズ分割
interviewScribeでは音声データを、発音している部分毎に分割し、「フレーズ」として管理します。 フレーズに分割することで、数秒のフレーズ毎に聞き取り作業を進められ、再生、聞き取り、テキス ト変換の一連の作業をスムーズに進めることが出来ます。• テープ起こし作業に特化した機能
interviewScribeでは、テープ起こし作業を考慮し、ダイレクトな再生位置の設定、再生速度の調整、 再生音質の調整など、テープ起こし作業に特化した機能を持っています。• システム音声入力との連携
さらに、システムに備わっている音声入力機能を活用して、テキスト変換を行うことも出来ます。 特徴的なのは、音声入力の開始に伴ってフレーズを自動再生させることで、再生音を音声入力に入力 して、テキストに変換することが出来ます。 この機能を使うと、良質な音声データ(例えばPodcastで配信されているニュース音声等)なら、驚 くほど簡単にテキストへ変換することが出来ます。• 聞き取り結果の出力
フレーズ毎に変換されたテキストを結合して、聞き取り結果テキストとして書き出すことが出来ま す。フレーズテキストの結合では、発音時間や話者がわかるようなヘッダーを付けることが出来ます。ま たヘッダーはsrtファイルフォーマットに準拠しているため、聞き取り結果テキストを動画の字幕テキス トとして使用することが出来ます。2. 聞き取りの準備
2.1.
音声ファイルを割り付ける
interviewScribeを起動し、新規ドキュメントを開いたら最初に聞き取りの対象となる音声フ ァイルを[ファイル] - [音声ファイルの割付...]メニューでドキュメントに割り付けます。 選択可能な音声ファイルの拡張子は.aif,.mp3,.mp4,.m4v,.m4a,.aifc,.aiff,.wav,.cafです。 割り付けられた音声ファイルは、そのコピーがドキュメント内に保存されますので、ドキュメ ントを配布する際には、音声ファイルの権利関係を侵害しないよう、ご注意下さい。 interviewScribe内部では、音声データを22.1kHzモノラル(L+R)として扱います。 割付が行われると、初期設定状態に従ってフレーズが自動生成されます。 音声データの音圧が低かったり、環境ノイズが大きくて、フレーズが適切に生成されなくて も、後で調整することが出来ます。 割付後は別音声ファイルを再割付することは出来ません。必要ならこのドキュメントを破棄 して、新規ドキュメントを作って下さい。4
2.2.
再生操作
音声データの再生は、出力機器を選び、一般的なプレイヤーと同様な操作で行います。再生
再生操作は[再生]メニューのショートカットキーを用いることで、効率的な作業が行えると思 います。 一時停止後の再々生では、一時停止時点より指定秒、前に戻って再生を開始することが出来 ます。 2.2.1. 再生開始位置と再生範囲 再生開始位置は全体音声スペクトル表示ビューおよび部分音声スペクトル表示ビューで 任意箇所をクリックして設定することが出来ます。 また、フレーズ表示ビューおよびフレーズリストでフレーズを選択すると、選択された フレーズの先頭を再生開始位置に、フレーズの末端までが再生範囲として設定されます。 全体音声スペクトル表示ビューでのクリック、および部分音声スペクトル表示ビューで 選択フレーズ外箇所をクリックすると、フレーズの選択状態が解除され、再生範囲はデータ エンドまでとなります。2.3.
音量、音質を調整する
2.3.1. 音量の調整 音声データの音圧が不足していると、聞き取りにくく、またフレーズの分割に支障が出 る場合が有ります。この様な時には音量スライダーで音圧を上げることが出来ます。 2.3.2. 音質の調整 音声データの再生音が聞き取りにくい場合はイコライザーを使って音質の補正を行うこ とが出来ます。6
2.4.
フレーズを調整する
音声データを割り付けた時に自動生成されたフレーズが適切でない場合はフレーズを調整する ことが出来ます。 2.4.1. フレーズの再生成 [フレーズの調整] タブでフレーズを再生成することが出来ます。 静寂判定値 部分音声スペクトル表示ビューのクリ ック箇所における音圧値 (静寂判定値を決めるための参考用) 静寂の継続期間 フレーズの最短長 フレーズテキストが編集されているフレーズは再生成の対象外となります。2.4.2. フレーズの結合 細かく分割されたフレーズを一つに結合することが出来ます。 結合したいフレーズの先頭フレーズをフレーズビューで選択し、[フレーズ] - [結合]メニ ューを指示すると、次のフレーズと結合されます。
選択フレーズ
2.4.3. フレーズの分割 長すぎるフレーズを二つに分割することも出来ます。 部分音声スペクトル表示ビューで分割したい箇所に再生開始位置を設定し、 [フレーズ] - [分割]メニューを指示すると、二つのフレーズに分割されます。8
2.4.4. フレーズテキストが編集されているフレーズの分割 フレーズテキストの編集は、後述の「3.聞き取り操作」にて述べますが、ここではフ レーズテキストが編集されているフレーズを分割する場合の操作について説明します。 フレーズテキストを任意箇所で分割するには、フレーズを選択し、フレーズ編集タブで 編集モードにした上で、分割したい箇所に編集カーソルを移動してから [フレーズ] - [分割] メニューを指示します。この操作により、フレーズテキストはカーソル位置で分割されま す。
①
②
③
① フレーズを選択 ② テキスト編集モードにする ③ 分割したい箇所にカーソルを移動 2.4.5. フレーズの位置と長さを調整する フレーズビューでフレーズの両端をドラッグすることで、フレーズの開始位置と長さを調 整することが出来ます。2.4.6. フレーズにフラグを設定する
重要なフレーズにフラグを設定することが出来ます。
←→キーを使うとフラグが設定されたフレーズを移動することが出来ます。
3. 聞き取り操作
3.1.
対象フレーズを選択する
聞き取り操作を行うフレーズを選択します。フレーズの選択は、下記操作で行います。 • フレーズビューでフレーズをクリックする。 • フレーズリストで対象行をクリックする。 • ↑↓キーでフレーズリストの選択行を移動させる。 (フレーズリストがアクティブな時に有効) • ←→キーでフラグが設定されたフレーズを移動させる。 ↑↓キーでフレーズリストを移動3.2.
フレーズテキストの編集
フレーズを選択し、タブ表示をフレーズ編集タブに切り替えます。 この状態で、[フレーズ] - [編集]メニュー指示、またはタブ画面下部の編集ボタンを押下して、 編集モードを変更することが出来ます。編集モードの状態は編集ボタンの押下状態で確認すること が出来ます。 編集モードになると、フレーズ編集タブのテキスト編集ビューが有効となり、テキスト入力が 行えるようになります。入力されたテキストは編集モードがオフとなった時点でフレーズに記憶さ れ、フレーズリストの発話内容項目とフレーズビューのフレーズ表示に入力テキストの一部が表示 され、あわせてフレーズビューのフレーズ表示が緑色になります。 テキストはリッチテキストとして扱うので、フォントサイズ、太文字、下線等の修飾が可能です。 フレーズ 「連続して編集する」をチェックしておくと、連続編集モードとなり、 [フレーズ] - [編集]メニ ュー指示で編集モードを終わらせた時、自動的に次のフレーズが編集モードになります。 (編集ボタンを押下して編集モードを終わらせた場合は次のフレーズには移行しません)12
3.3.
システム 音声入力を使ってテキスト編集を行う
良質な音声データ※であればMac OS 10.8の「音声入力」機能を使ってテキスト編集を効率 的に進めることが出来ます。 ※ 良質な音声データとは、SN比が高く、話者の滑舌が良い音声データを意味しています。 3.3.1. システム 音声入力側の設定 「システム環境設定」にて「音声入力と読み上げ」の設定パネルを表示します。①
②
③
① 入力機器の設定 interviewScribeで指定した出力機器からの音声が取り込める入力機器を選択します。 例えば出力を内蔵スピーカーに指定した場合は内蔵マイクを入力機器として選べば音声が 取り込めます。 ② ショートカットの選択 interviewScribeで対応出来る下図赤線枠内のショートカットを選択して下さい。 ③ 言語の選択 聞き取り言語を選択します。 ※システム 音声入力はインターネットに接続出来る環境でないと使用出来ません。3.3.2. interviewScribe側の設定 出力機器からシステム音声入力へ音声が流れるように出力機器を指定します。 環境設定タブで音声入力のショートカットをシステム音声入力で設定したショートカッ トに合わせます。 そして、フレーズ編集タブの 「音声入力開始時に自動再生する」 ボタンまたは、[再生] - [音声入力開始時に自動再生する]で、音声入力開始時にフレーズ音声の再生を行うか否か を設定します。
再生
14
3.3.3. 音声入力を使ってフレーズテキストを編集する フレーズを選択し、テキスト編集モードにします。 この状態で[編集] - [音声入力を開始]メニュー指示またはショートカットを指示すると音 声入力が開始され、併せてフレーズ音声の再生が開始されます。( 音声入力開始時に自動 再生する がオンの時)音声の再生が終了したら音声入力の完了を指示すると、変換テキス トがフレーズ編集タブの編集ビューに入力されます。 誤変換された箇所を適時修正します。 一回の音声入力で可能な入力時間は約30秒なので、フレーズが30秒以上継続する場合 は、適時フレーズを分割して下さい。 音声入力が突然受け付けられなくなる場合が有るようです。このような場合は暫く待っ てから音声入力を行って下さい。 フレーズ音声の認識率が低い場合は、 「音声入力開始時に自動再生する」 をオフにし て、音声入力開始で再生が行われないようにしておき、手動再生した内容を貴方が滑舌よく 復唱して音声入力すると認識率を上げることが出来ます。
3.3.4. interviewScribeの出力をダイレクトに音声入力に入力する
前記した例では内蔵スピーカーへの出力を内蔵マイクで拾う設定でしたが、騒音下での 作業や、静寂が求められる環境での作業には適していないかもしれません。
ここでは、このような環境下でご使用頂くための手法を紹介致します。
この手法では、interviewScribeの他に Soundflowerという仮想AudioDeviceを使用し ます。Soundflowerは、cycling74.comにて配布されているフリーの仮想AudioDeviceで す。Soundflowerをインストールすると、入出力AudioDeviceとして認識されるので、 interviewScribeの出力とシステム音声入力の入力にSoundflower(2ch)を割り付ければ、 外部に音を出すことなくMac内で接続させることが出来ます。また、Soundflowerのユー ティリティソフト、SoundflowerbedによりSoundflowerに入力された音声を他の出力機 器にも出力させることが出来るので、ヘッドフォン等にて再生音を確認しながら作業を進め ることが出来ます。Soundflowerに関する情報はWebにて「Soundflower」で検索すれ ば、多くの情報を得ることが出来ます。 ただ、この場合は復唱にて音声入力を行うことが出来なくなります。(内蔵マイクから の音声をSoundflowerに入力することが出来ないため)復唱入力を実現するためには、も う一つ入力機器と出力機器を繋げることが出来るAppが必要となります。ネットを検索すれ ばフリーのソフトが見つかるかも知れませんが、ここでは弊社の「TuneUpAid」というソ フトをご紹介しておきます。
16
3.4.
話者を分類する
話者が複数存在する場合(質問者と回答者、または会議での発言者等)話者とフレーズを関 連づけることが出来ます。
話者は、話者タブ画面にて登録、命名し、フレーズリストの話者欄で選択してフレーズに関連 づけます。
3.5.
聞き取り結果を得る
必要なフレーズのテキスト変換が終わったら聞き取り編集タブを使って、最終結果を得ること が出来ます。
聞き取り結果は複数のバリエーションを持つことが出来ます。
フレーズテキストの結合は「フレーズテキストを結合」ボタンを押下して行います。この時、 各フレーズ毎に発話時間と話者をヘッダーとして挿入することも出来ます。 ヘッダーはsrtファイルフォーマットに準拠しているので、mp4動画ファイルの聞き取り結果 を字幕テキストとして使用することも可能です。 また、句読点(。!?.!?)での自動改行と半角スペースの挿入を指定することも出来ます。 聞き取り編集タブでは直接テキストをリッチテキストとして編集することも出来ます。聞き 取り編集内容はドキュメントに保存され、[ファイル]-[書き出す...]メニューにてテキストファイ ルとして書き出すことが出来ます。