help_ja

(1)

interviewScribe ユーザーズガイド

(2)

1.概要 3 2.聞き取りの準備 4 2.1. 音声ファイルを割り付ける 4 2.2. 再生操作 5 2.3. 音量、音質を調整する 6 2.4. フレーズを調整する 7 3.聞き取り操作 11 3.1. 対象フレーズを選択する 11 3.2. フレーズテキストの編集 12 3.3. システム音声入力を使ってテキスト編集を行う 13 3.4. 話者を分類する 17 3.5. 聞き取り結果を得る 18 4.改訂履歴 20

2

(3)

1. 概要

interviewScribeは、テープ起こし作業を効率的に行うためのツールです。

• フレーズ分割

interviewScribeでは音声データを、発音している部分毎に分割し、「フレーズ」として管理します。フレーズに分割することで、数秒のフレーズ毎に聞き取り作業を進められ、再生、聞き取り、テキスト変換の一連の作業をスムーズに進めることが出来ます。

• テープ起こし作業に特化した機能

interviewScribeでは、テープ起こし作業を考慮し、ダイレクトな再生位置の設定、再生速度の調整、再生音質の調整など、テープ起こし作業に特化した機能を持っています。

• システム音声入力との連携

さらに、システムに備わっている音声入力機能を活用して、テキスト変換を行うことも出来ます。特徴的なのは、音声入力の開始に伴ってフレーズを自動再生させることで、再生音を音声入力に入力して、テキストに変換することが出来ます。この機能を使うと、良質な音声データ（例えばPodcastで配信されているニュース音声等）なら、驚くほど簡単にテキストへ変換することが出来ます。

• 聞き取り結果の出力

フレーズ毎に変換されたテキストを結合して、聞き取り結果テキストとして書き出すことが出来ます。フレーズテキストの結合では、発音時間や話者がわかるようなヘッダーを付けることが出来ます。またヘッダーはsrtファイルフォーマットに準拠しているため、聞き取り結果テキストを動画の字幕テキストとして使用することが出来ます。

(4)

2. 聞き取りの準備

2.1. 音声ファイルを割り付ける

interviewScribeを起動し、新規ドキュメントを開いたら最初に聞き取りの対象となる音声ファイルを[ファイル] - [音声ファイルの割付...]メニューでドキュメントに割り付けます。選択可能な音声ファイルの拡張子は.aif,.mp3,.mp4,.m4v,.m4a,.aifc,.aiﬀ,.wav,.cafです。割り付けられた音声ファイルは、そのコピーがドキュメント内に保存されますので、ドキュメントを配布する際には、音声ファイルの権利関係を侵害しないよう、ご注意下さい。 interviewScribe内部では、音声データを22.1kHzモノラル(L+R)として扱います。割付が行われると、初期設定状態に従ってフレーズが自動生成されます。音声データの音圧が低かったり、環境ノイズが大きくて、フレーズが適切に生成されなくても、後で調整することが出来ます。割付後は別音声ファイルを再割付することは出来ません。必要ならこのドキュメントを破棄して、新規ドキュメントを作って下さい。

4

(5)

2.2. 再生操作

音声データの再生は、出力機器を選び、一般的なプレイヤーと同様な操作で行います。

再生

再生操作は[再生]メニューのショートカットキーを用いることで、効率的な作業が行えると思います。一時停止後の再々生では、一時停止時点より指定秒、前に戻って再生を開始することが出来ます。 2.2.1. 再生開始位置と再生範囲再生開始位置は全体音声スペクトル表示ビューおよび部分音声スペクトル表示ビューで任意箇所をクリックして設定することが出来ます。また、フレーズ表示ビューおよびフレーズリストでフレーズを選択すると、選択されたフレーズの先頭を再生開始位置に、フレーズの末端までが再生範囲として設定されます。全体音声スペクトル表示ビューでのクリック、および部分音声スペクトル表示ビューで選択フレーズ外箇所をクリックすると、フレーズの選択状態が解除され、再生範囲はデータエンドまでとなります。

(6)

2.3. 音量、音質を調整する

2.3.1. 音量の調整音声データの音圧が不足していると、聞き取りにくく、またフレーズの分割に支障が出る場合が有ります。この様な時には音量スライダーで音圧を上げることが出来ます。 2.3.2. 音質の調整音声データの再生音が聞き取りにくい場合はイコライザーを使って音質の補正を行うことが出来ます。

6

(7)

2.4. フレーズを調整する

音声データを割り付けた時に自動生成されたフレーズが適切でない場合はフレーズを調整することが出来ます。 2.4.1. フレーズの再生成 [フレーズの調整] タブでフレーズを再生成することが出来ます。静寂判定値部分音声スペクトル表示ビューのクリック箇所における音圧値（静寂判定値を決めるための参考用）静寂の継続期間フレーズの最短長フレーズテキストが編集されているフレーズは再生成の対象外となります。

(8)

2.4.2. フレーズの結合細かく分割されたフレーズを一つに結合することが出来ます。結合したいフレーズの先頭フレーズをフレーズビューで選択し、[フレーズ] - [結合]メニューを指示すると、次のフレーズと結合されます。

選択フレーズ

2.4.3. フレーズの分割長すぎるフレーズを二つに分割することも出来ます。部分音声スペクトル表示ビューで分割したい箇所に再生開始位置を設定し、 [フレーズ] - [分割]メニューを指示すると、二つのフレーズに分割されます。

8

(9)

2.4.4. フレーズテキストが編集されているフレーズの分割フレーズテキストの編集は、後述の「３．聞き取り操作」にて述べますが、ここではフレーズテキストが編集されているフレーズを分割する場合の操作について説明します。フレーズテキストを任意箇所で分割するには、フレーズを選択し、フレーズ編集タブで編集モードにした上で、分割したい箇所に編集カーソルを移動してから [フレーズ] - [分割] メニューを指示します。この操作により、フレーズテキストはカーソル位置で分割されます。

①

②

③

① フレーズを選択 ② テキスト編集モードにする ③ 分割したい箇所にカーソルを移動 2.4.5. フレーズの位置と長さを調整するフレーズビューでフレーズの両端をドラッグすることで、フレーズの開始位置と長さを調整することが出来ます。

(10)

2.4.6. フレーズにフラグを設定する

重要なフレーズにフラグを設定することが出来ます。

←→キーを使うとフラグが設定されたフレーズを移動することが出来ます。

(11)

3. 聞き取り操作

3.1. 対象フレーズを選択する

聞き取り操作を行うフレーズを選択します。フレーズの選択は、下記操作で行います。 • フレーズビューでフレーズをクリックする。 • フレーズリストで対象行をクリックする。 • ↑↓キーでフレーズリストの選択行を移動させる。（フレーズリストがアクティブな時に有効） • ←→キーでフラグが設定されたフレーズを移動させる。 ↑↓キーでフレーズリストを移動

(12)

3.2. フレーズテキストの編集

フレーズを選択し、タブ表示をフレーズ編集タブに切り替えます。この状態で、[フレーズ] - [編集]メニュー指示、またはタブ画面下部の編集ボタンを押下して、編集モードを変更することが出来ます。編集モードの状態は編集ボタンの押下状態で確認することが出来ます。編集モードになると、フレーズ編集タブのテキスト編集ビューが有効となり、テキスト入力が行えるようになります。入力されたテキストは編集モードがオフとなった時点でフレーズに記憶され、フレーズリストの発話内容項目とフレーズビューのフレーズ表示に入力テキストの一部が表示され、あわせてフレーズビューのフレーズ表示が緑色になります。テキストはリッチテキストとして扱うので、フォントサイズ、太文字、下線等の修飾が可能です。フレーズ「連続して編集する」をチェックしておくと、連続編集モードとなり、 [フレーズ] - [編集]メニュー指示で編集モードを終わらせた時、自動的に次のフレーズが編集モードになります。（編集ボタンを押下して編集モードを終わらせた場合は次のフレーズには移行しません）

12

(13)

3.3. システム音声入力を使ってテキスト編集を行う

良質な音声データ※_{であればMac OS 10.8の「音声入力」機能を使ってテキスト編集を効率} 的に進めることが出来ます。 ※ 良質な音声データとは、SN比が高く、話者の滑舌が良い音声データを意味しています。 3.3.1. システム音声入力側の設定「システム環境設定」にて「音声入力と読み上げ」の設定パネルを表示します。

①

②

③

① 入力機器の設定 interviewScribeで指定した出力機器からの音声が取り込める入力機器を選択します。例えば出力を内蔵スピーカーに指定した場合は内蔵マイクを入力機器として選べば音声が取り込めます。 ② ショートカットの選択 interviewScribeで対応出来る下図赤線枠内のショートカットを選択して下さい。 ③ 言語の選択聞き取り言語を選択します。 ※システム音声入力はインターネットに接続出来る環境でないと使用出来ません。

(14)

3.3.2. interviewScribe側の設定出力機器からシステム音声入力へ音声が流れるように出力機器を指定します。環境設定タブで音声入力のショートカットをシステム音声入力で設定したショートカットに合わせます。そして、フレーズ編集タブの「音声入力開始時に自動再生する」ボタンまたは、[再生] - [音声入力開始時に自動再生する]で、音声入力開始時にフレーズ音声の再生を行うか否かを設定します。

再生

14

(15)

3.3.3. 音声入力を使ってフレーズテキストを編集するフレーズを選択し、テキスト編集モードにします。この状態で[編集] - [音声入力を開始]メニュー指示またはショートカットを指示すると音声入力が開始され、併せてフレーズ音声の再生が開始されます。（音声入力開始時に自動再生するがオンの時）音声の再生が終了したら音声入力の完了を指示すると、変換テキストがフレーズ編集タブの編集ビューに入力されます。誤変換された箇所を適時修正します。一回の音声入力で可能な入力時間は約30秒なので、フレーズが30秒以上継続する場合は、適時フレーズを分割して下さい。音声入力が突然受け付けられなくなる場合が有るようです。このような場合は暫く待ってから音声入力を行って下さい。フレーズ音声の認識率が低い場合は、「音声入力開始時に自動再生する」をオフにして、音声入力開始で再生が行われないようにしておき、手動再生した内容を貴方が滑舌よく復唱して音声入力すると認識率を上げることが出来ます。

(16)

3.3.4. interviewScribeの出力をダイレクトに音声入力に入力する

前記した例では内蔵スピーカーへの出力を内蔵マイクで拾う設定でしたが、騒音下での作業や、静寂が求められる環境での作業には適していないかもしれません。

ここでは、このような環境下でご使用頂くための手法を紹介致します。

この手法では、interviewScribeの他に Soundflowerという仮想AudioDeviceを使用します。Soundflowerは、cycling74.comにて配布されているフリーの仮想AudioDeviceです。Soundflowerをインストールすると、入出力AudioDeviceとして認識されるので、 interviewScribeの出力とシステム音声入力の入力にSoundflower(2ch)を割り付ければ、外部に音を出すことなくMac内で接続させることが出来ます。また、Soundflowerのユーティリティソフト、SoundflowerbedによりSoundflowerに入力された音声を他の出力機器にも出力させることが出来るので、ヘッドフォン等にて再生音を確認しながら作業を進めることが出来ます。Soundflowerに関する情報はWebにて「Soundflower」で検索すれば、多くの情報を得ることが出来ます。ただ、この場合は復唱にて音声入力を行うことが出来なくなります。（内蔵マイクからの音声をSoundflowerに入力することが出来ないため）復唱入力を実現するためには、もう一つ入力機器と出力機器を繋げることが出来るAppが必要となります。ネットを検索すればフリーのソフトが見つかるかも知れませんが、ここでは弊社の「TuneUpAid」というソフトをご紹介しておきます。

16

(17)

3.4. 話者を分類する

話者が複数存在する場合（質問者と回答者、または会議での発言者等）話者とフレーズを関連づけることが出来ます。

話者は、話者タブ画面にて登録、命名し、フレーズリストの話者欄で選択してフレーズに関連づけます。

(18)

3.5. 聞き取り結果を得る

必要なフレーズのテキスト変換が終わったら聞き取り編集タブを使って、最終結果を得ることが出来ます。

聞き取り結果は複数のバリエーションを持つことが出来ます。

(19)

フレーズテキストの結合は「フレーズテキストを結合」ボタンを押下して行います。この時、各フレーズ毎に発話時間と話者をヘッダーとして挿入することも出来ます。ヘッダーはsrtファイルフォーマットに準拠しているので、mp4動画ファイルの聞き取り結果を字幕テキストとして使用することも可能です。また、句読点（。！？.!?）での自動改行と半角スペースの挿入を指定することも出来ます。聞き取り編集タブでは直接テキストをリッチテキストとして編集することも出来ます。聞き取り編集内容はドキュメントに保存され、[ファイル]-[書き出す...]メニューにてテキストファイルとして書き出すことが出来ます。

(20)

4. 改訂履歴

... 12/9/24 初版発行 ... 12/10/25 「2.4.1 フレーズの再生成」を修正 ... 13/5/8 ver2 による改訂 ... 13/9/4 ver3 による改訂

help_ja

interviewScribe ユーザーズガイド

目次

2

1. 概要

interviewScribeは、テープ起こし作業を効率的に行うためのツールです。

• フレーズ分割

• テープ起こし作業に特化した機能

• システム音声入力との連携

• 聞き取り結果の出力

2. 聞き取りの準備

2.1.

音声ファイルを割り付ける

4

2.2.

再生操作

再生

2.3.

音量、音質を調整する

6

2.4.

フレーズを調整する

選択フレーズ

8

①

②

③

3. 聞き取り操作

3.1.

対象フレーズを選択する

3.2.

フレーズテキストの編集

12

3.3.

システム 音声入力を使ってテキスト編集を行う

①

②

③

再生

14

16

3.4.

話者を分類する

3.5.

聞き取り結果を得る

4. 改訂履歴

20

システム音声入力を使ってテキスト編集を行う