Premiere Pro 2021に搭載された最新機能「自動文字起こし」について解説します。
以前はbetaのみの提供でしたが、アップデートによって正式対応しました。
自動の文字起こしはVrewという無料の自動文字起こしソフトをつかっていた人も多かったと思いますが、Premiere Proに内蔵されたことでソフト間の移動や書き出しの手間が省け、作業が大幅に効率化されます。
- 自動文字起こし機能の使い方は?
- 自動文字起こしってどんな機能?精度は?
- デメリットや苦手なことはあるの?
こんな疑問にお答えします。
自動文字起こし機能の使い方

Premiere Proの自動文字起こし機能の使い方はとってもかんたん。
テキストパネルを表示して【文字起こし開始】を押すだけでAIが自動で字幕を挿入してくれます。
自動文字起こし機能の手順
自動文字起こしの具体的な操作手順は以下のとおり。
- オーディオを含んだシーケンスを選択
- メニュー【ウィンドウ】→【テキスト】
- 文字起こしタブで【自動文字起こしを開始】
- 必要に応じて文字起こし設定を行う
- 青い【文字起こし開始】をクリック
- 自動で文字起こしされるので校正して完了
操作方法は非常にかんたんですが、キャプチャ付きで詳しく解説していきます。
オーディオを含んだ音声またはビデオシーケンスを選択した状態で作業を行います。
自動文字起こしはテキストパネルにて行います。

一番上のメニューバーにある【ウィンドウ】を選択し、中にある【テキスト】を選択してテキストパネルが表示されます。
テキストを選択後、以下の画面が表示されます。

テキストパネルを表示したら【文字起こし】のタブを選択して【自動文字起こしを開始】を選択しましょう。
文字起こしオプションが表示されます。
必要に応じて文字起こしのオプションを設定できます。
よくわからなければ言語を日本語に変更して【文字起こし開始】を選択するだけでOK

- オーディオ分析
タグ付けされたオーディオクリップまたは選択したオーディオトラックから文字起こしするかを選択 - 言語
基本的に日本語を選択(13ヶ国語を選択可能) - インからアウトの間のみを文字起こし
インとアウトをマークしている場合、範囲内で文字起こし可能 - 出力を既存の文字起こしとマージする
既存の文字起こしとマージ(結合)する - さまざまな話者が話しているときに認識することをオプトインする
シーケンスまたはビデオに複数人の音声がある場合に選択
以上で自動文字起こしは完了です。あとは必要に応じて話者を設定したり、文章のおかしいところを修正しましょう。

【・・・不明】と表示されている部分をクリックして話している人の名前を入力します。
自動文字起こしされたテキストをダブルクリックすれば誤字脱字を修正可能です。
テキストの修正が終わったら【キャプションの作成】を押して一括でキャプション化を行います。
この際にキャプションの「プリセット」「形式」「文字の最大長さ」など細かなスタイルを指定することができます。

キャプション化を行うと図のようにタイムラインに合わせてキャプションを挿入してくれます。
タイミングも音声に合わせてくれているのでこれで完成です。
キャプションのスタイライズ
自動文字起こしで作成したキャプションはあとからでも変更したり、フォントやサイズを変更することができます。
- ウィンドウ→ワークスペース→キャプション
- エッセンシャルグラフィックスパネルでスタイル変更
- アピアランス設定で色やふちどり変更
エッセンシャルグラフィックスパネルから「スタイルを作成」でお気に入りのキャプションスタイルを作成しておけば次回以降は作成したプリセットを選ぶだけで自動でスタイルを適用してくれるので更に便利になります。
自動書き起こしテキストの検索と置き換え
固有名詞、専門用語、同音異字で他の文字として文字起こしされていることは多々あります。
そんなときは一文字一文字修正していかなくても、検索と置き換え機能を使えば一発ですべて置き換えることが可能です。

- 検索バーにテキストを入力
- 文字起こしタブ右側の[…]マーク
- 検索項目を置き換え
文字起こしデータの書き出し
校正用や管理用に文字起こししたテキストを.txtファイルとして書き出すことができます。

- 文字起こしタブ右側の[…]マーク
- テキストファイルに書き出し
- 保存先を指定して【保存】
この際に【文字起こしデータを書き出し】を選択した場合はPremiere Proの文字起こしパネルで開ける..prtranscriptファイルで書き出すこともできます。
必要に応じて書き出し方法を変更しましょう。
文字起こしのやり直し(静的な文字起こしを生成)

すでに作成済の文字起こしテキストを、再度文字起こしをやり直したい場合の手順は以下の通り。
- テキストパネルを開く(ウィンドウ→テキスト)
- 右上にあるオプションボタン【・・・】を選択
- 静的な文字起こしを生成をクリックして再生成
Premiere Proの文字起こし機能のメリット

Premiere Proの文字起こし機能のメリットは以下のとおり
- 初心者でもかんたんに使える
- 時間のかかる文字入力作業が一瞬で終わる
- スタイル設定で文字デザインの手間がなくなる
- 文字起こしした文章はテキストデータとして書き出せる
- 音声認識の精度が高く、正確に文字起こしできる
初心者でもかんたんに使える
Premiere Pro内臓で、初心者でも簡単に使えるっていうのが最大の魅力。
最初に使い方を解説しましたが、実際にやることは数回のクリックだけです。
最終的には校正する必要がありますが、基本的な操作は超簡単なのではじめてPremiere Proを触る人でも容易に利用ができます。
時間のかかる文字入力作業が一瞬
動画編集で一番作業時間がかかるであろうテロップ作業、これを一瞬で終わらせてくれる神機能です。
作業自体は別に難しくもない簡単な以下の作業
- 音声を聞く
- 文字を入力する
- 発声タイミングに合わせる
しかしこれは動画が長くなればなるほど、時間がかかる大変な作業に変化します。
そんな面倒な作業をAIに任せられるんだから最高。
スタイル設定でデザインの変更も手間もカット
スタイル設定を行えばフォント、サイズ、色などを装飾した状態で音声に合わせたタイミングでタイムラインに挿入してくれます。
テキストの配置位置なども自由にカスタマイズ可能なので最初に設定しておけば次回以降のテロップ作業が劇的に楽になります。
文字起こししたテキストデータは外部出力も可能
動画データとして保存するだけでなく、文字起こしデータとして書き出し・共有することができます。
また、汎用性の高い.txtファイルとして書き出してエクセルやワードで校正したりも可能。
書き出し方法は前述した「文字起こしデータの書き出し」の頁をご覧ください。
他社製の無料文字起こしソフトより精度が良い
AIをつかった文字起こしソフトは多々ありますが、無料で提供されているものよりも圧倒的に精度が高くなっています。
ハキハキと喋っていないとしっかりと文字起こししてくれないものも多いですが、Premiere Proはちょっと聞き取りにくいような発音でもしっかりとテキスト変換してくれています。
自動文字起こしをエッセンシャルグラフィックスに変換(Premiere Pro 2023)

キャプションには個々のトラックにエフェクトやテキスト装飾ができませんでしたが、最新のアップデートでキャプションをエッセンシャルグラフィックスに変換することが可能になりました。
エッセンシャルグラフィックスは自由度が高く編集も容易なので多くの人が待ち望んでいた機能となります。
自動文字起こししたキャプションをエッセンシャルグラフィックスに変える方法
Premiere Pro 2023の最新バージョンに追加された機能なので最新バージョンにアップデートする必要があります。
エッセンシャルグラフィックスへの変換方法は以下の通り。

- 通常通り「ウィンドウ」→「テキスト」から「文字起こし開始」
- キャプションタブで「文字起こしからキャプションを作成」
- キャプションを選択する
- メニュー「グラフィックとタイトル」
- キャプションをグラフィックにアップグレード
これだけの手順でキャプショントラックがすべてエッセンシャルグラフィックスに変換されます。
黄色のキャプションが紫色のエッセンシャルグラフィックスに変われば完了です。
エッセンシャルグラフィックスに変換したテロップは編集が容易
編集しにくかったキャプションをエッセンシャルグラフィックスに変換すればテンプレートを適用したり、個々にデザインやフォントを変更しやすくなります。
文字の編集やテロップデザインを個別に変更する機械が多い場合はぜひエッセンシャルグラフィックスに変換してみてください。
Premiere Proの自動文字起こしの精度は?
私はベータ版のときから本機能を使用していましたが、体感的にはかなりの精度で変換してくれています。
流石にノーチェックで自動翻訳のみというわけにはいきませんが、ちょこちょこ修正する程度で済むので普通に実務利用できるレベル。
Vrewよりも精度が良い
以前つかっていたVrewという文字起こしツールは精度が高く便利だったんですが、Premiere Proと行ったり来たりで地味に時間がかかっていた作業を大幅にカットできるというのもいいですね。
Vrewでは認識しにくかったような屋外でのiPhoneカメラ&マイクで撮影した動画でもはっきりと認識してくれています。
AI作成した自動音声も自動テロップ化できる
ゆっくり音声やCoeFontで作成した音源を自動文字起こししてみましたが精度良く文字起こししてくれています。
あまり使うシーンはないかもしれませんが、テキスト書き出しもできるので自動音声を逆にテキストに変化するっていうことも可能です。
発声タイミングも正確
本機能は文字の入力作業が楽っていうだけでなく、発声タイミングをタイムラインに正確に合わせてくれるっていうのが超絶便利なポイント。
オーディオバーの波形を見ながらインとアウトマークを指定する必要もなくなります。
自動文字起こし機能のデメリットや注意点
超絶便利な自動文字起こし機能ですが、デメリットと言うかまだ完全でない点もあります。
専門用語や同音異字には注意
AIが自動で文字に変換するため、以下のような言葉や単語には弱くなっています。
- 専門用語
- 同音異字
- 固有名詞
- ネットスラング
また、一般的な言葉でないものはうまく認識されません。
早口や滑舌が悪い言葉には弱い
ビジネスシーンのような複数人いる会話でもはっきりと認識してくれ、人ごとにキャプションを分別してくれます。
しかし、早口で滑舌が悪いような音声はうまく認識しない場合があります。
例えばVtuber系で複数人が同時にガヤガヤ喋るようなものや、実況で早口なものなど。
インターネット接続が不要に

当初はAdobeのサーバーにて処理を行うため、オーディオファイルをアップロードしてインターネット接続が必要でしたが、現在はオフラインでも文字起こしが可能になっています。
最新バージョンでは文字起こしの処理が動画の読み込みと同時に行われる設定も追加されるため、作業がよりスムーズになります。
常に進化を続けるAdobe Senseiに期待
自動で文字起こししてくれるAdobe Senseiは常に進化を続けています。
今現在は正確に認識していない言葉でも数カ月後には正確に変換してくれてたりしますので現状苦手な上記のような項目も1年後には問題なく変換できるようになっているかもしれません。
完璧ではないとは言え、進化を続けているのでAIをつかった新しい技術は積極的にどんどん取り入れていきましょう!


アップデートにて「文字起こしベースの編集」に対応
後日リリースされる最新バージョンからは動画をPremiere Proに読み込むと自動で文字起こし処理が行われるようになります。
そして、文字起こししした文章を元に、編集箇所を検索したり、文章だけをみて不要箇所を削除したり、クリップの順番を入れ替えたりできるようになる「文字起こしベースの編集」ができるようになります。
アップデートは2023年5月の予定です!
コメント
コメント一覧 (1件)
久しぶりに素晴らしいコンテンツのクオリティを書いてくれている人に出逢った。丁寧に解説してくれてありがとう!