ビデオ制作のスピードアップとコスト削減を目的として、AI の音声とアバターをテストするトレーニング チームが増えていますが、まだ躊躇しています。学習者はこれらの形式を真剣に受け止めますか?安っぽい、または気が散るという印象を与える可能性はありますか?そして、人々がチャンネルを外したらどうなるでしょうか?
意見を超えて進むために、Camtasia チームは教育ビデオに焦点を当てた 2 つの世界的な視聴者調査を実施しました。
参加者は、ナレーションの音声またはプレゼンターの形式を除いて同一の短いトレーニング クリップを視聴しました。次に、プロフェッショナリズム、自信、エンゲージメントを評価し、定着率を測定するための簡単なクイズに答えました。
目標は、制御された環境で実際の学習者が AI 音声や AI アバターにどのように反応するかを理解することでした。各形式がどこに役立つのか、どこが不十分なのか、そして実際に学習成果にどのような影響を与えるのかについて私たちが発見したことは次のとおりです。
重要なポイント
- AI であれ人間であれ、質の高い音声により、プロ意識の認識が一貫して高まり、定着率も向上しました。本当の問題は、低品質のロボットのような音声でした。
- 学習者は、特に音声が自然で洗練されている場合、高品質の AI 音声が AI なのか人間なのか区別できないことがよくありました。
- すべての形式において、AI アバター動画はプロフェッショナルで繰り返し視聴できると評価されましたが、画面ベースの指導ではアバター ピクチャ イン ピクチャが最も高い学習定着率をもたらしました。
- 全画面アバターにより、視聴者はロボットの特徴に気づきやすくなり、品質評価が低下し、作業から注意が逸れてしまいました。
- ピクチャー・イン・ピクチャーのアバター形式は、有意に高い理解力を示し、プレゼンターのサイズと配置が学習に影響を与えることを示唆しています。
この研究を持ち帰ってください。
AI スタディを PDF としてダウンロードすると、タブを使用せずにオフラインで読み、AI ビデオ戦略を計画できます。
電子メール アドレスを送信すると、TechSmith からの電子メールを受信することに同意したことになります。いつでも購読を解除できます。
AI Voices の調査により、トレーニング ビデオの音声についてわかったこと
学習者は実際に人間の声とAIの声の違いを聞き分けることができるのでしょうか? AI 音声の調査では、視聴者は Google 高度な検索で同じ短い説明ビデオを視聴しましたが、音声のみが変化しました。
高品質の人間の音声、低品質の人間の音声、高品質の AI 音声、低品質の AI 音声の 4 つのバージョンがありました。他はすべて同じなので、ナレーションだけを評価できます。
視聴者には、過去 30 日間に少なくとも 1 つの教育ビデオを視聴した 18 ~ 64 歳のフルタイム労働者 768 人が含まれていました。 参加者は米国、英国、カナダ、オーストラリアから来ました。
AI と人間よりも音声の品質が重要である理由
本当に学習者に注意を向けさせるものは何でしょうか?人間か AI かに関係なく、クリアで温かく、洗練された声です。研究で音声の質が向上するにつれて、プロ意識の評価も向上しました。実際、 視聴者の92% は、高品質の AI 音声により、ビデオがプロによって制作されたように感じられると回答しました。
学習と開発 (L&D) およびトレーニング リーダーにとって、本当のリスクは AI 自体ではありません。オーディオ品質が低いため、コンテンツを理解する(および学習する)のが難しくなり、気が散ってしまう可能性があります。
ここで、Camtasia のようなツールがクリエイターの目標を達成するのに役立ちます。クリーンなオーディオをキャプチャして編集したり、バックグラウンド ノイズを軽減したり、自然でプロフェッショナルに聞こえる AI を活用したテキスト読み上げオプションを使用したりすることが、すべてスタジオのセットアップなしで行うことができます。
AI の音声は学習の定着に役立ちますか、それとも悪影響を及ぼしますか?
私たちの研究の「ポップクイズ」 部分の結果から、音声の品質が向上するにつれて正解が増加したというパターンが明らかです。 実際、高品質の AI 音声は、低品質の人間の 1 つの外れ値を除けば、最も強力な保持数を生み出しました。
なぜこのようなことが起こるのでしょうか?私たちは、オーディオの質が悪いと摩擦が生じると考えています。ナレーションが不均一に聞こえたり、人工的に聞こえたり、聞き取りにくい場合、学習者は何を言っているのかを理解するためにさらに努力する必要があり、認知的負荷がかかります。クリアでスムーズな音声により、視聴者は配信ではなく手順やコンセプトに集中できます。高品質の AI 音声は、平凡な人間の録音と同等かそれ以上に学習をサポートします。
しかし、AI の声は全体的に気が散るのでしょうか?場合によります。低品質の合成音声は紛れもなく、コンテンツから注意をそらします。 AI の音声が自然に聞こえる場合は多くの視聴者は人間の声と区別できません。違いはあまり気にならなくなり、情報保持力は安定するか、向上することさえあります。
実際的な次のステップはパイロット テストです。 完全なプログラムを展開する前に、AI バージョンと人間の音声バージョン間でクイズのパフォーマンスと学習者のフィードバックを比較します。これは、AI 音声が不必要な労力を加えることなく学習をサポートしているかどうかを確認するのに役立ちます。
学習者の快適さ、開示への期待、地域差
私たちの調査では、多くの学習者は高品質の AI 音声が AI なのか人間なのかを見分けることができませんでした。そのため、透明性が重要な考慮事項となります。 このレベルの自然さは印象的ですが、情報開示に関する重要な疑問も生じます。
英語圏の視聴者はAI音声が使用されたことを公表することを好む傾向があったが、ドイツの参加者はそれほど懸念しなかった。英国は特に際立っており、英国の学習者は AI ナレーション付きビデオに対して特にオープンでした。これらの違いは、世界中の視聴者向けのトレーニングを設計する際に重要になります。
L&D チームにとって、開示は法的手続きよりも信頼構築の選択肢として最も効果的です。ビデオの説明またはモジュールの冒頭に「AI 音声でナレーション」などの短い注記を付けると、内容から気を散らすことなく学習者を安心させることができます。
文化的な期待を事前に考慮しておくことで、より広範なトレーニング カタログにわたって AI ナレーションを拡張することが容易になります。学習者が何を期待すべきかを理解し、情報を与えられていると感じると、より学習に取り組み、AI がサポートする形式により早く適応します。
これはコストと効率にもつながります。学習者が AI 音声ナレーションに慣れると、チームは信頼性や定着率を犠牲にすることなく、より多くのトレーニング プログラムにわたってその使用を拡大できます。高品質の音声と組み合わせることで、思慮深い開示を行うことで、指示そのものに注意を集中させます。
AI 音声が時間を節約する場所 (および時間を再投資する方法)
注:前に参照した研究では、生産効率を測定していません。以下は、研究結果ではなく、トレーニング チーム全体で観察された一般的な実践とワークフローを反映しています。
AI 音声により、トレーニングの制作にかかる時間を大幅に節約できます。プレゼンターをスケジュールしたり、録画時間を予約したりする必要はなく、スクリプトは即座に更新および再生成できます。複数の言語へのローカリゼーションも、すべてのバージョンを再録音することなく、はるかに簡単になります。
節約された時間は、学習体験の向上に直接当てられます。チームは、より明確なキャプション、カーソルの強調、よりスムーズなペースで Camtasia のビジュアルを強化できます。シナリオベースの例をさらに追加したり、クイズやチェックポイントを作成したり、コンテンツをより頻繁に更新して、製品やプロセスの変更に合わせてトレーニングを維持したりできます。
AI 音声によって仕事がなくなるわけではありません。ナレーションセッションを繰り返すのではなく、より良い指導とビジュアル化に努力を移します。
トレーニング ビデオを正確に保ちます。 「AI スロップ」を避けてください。
品質を犠牲にすることなく、トレーニング コンテンツをより迅速に作成します。 HUMAN フレームワークは、AI を効果的に統合するための 5 段階の戦略です。
ガイドを入手する
AI アバターの調査から、トレーニングにおけるビジュアル AI について分かること
私たちの AI アバターの調査は音声調査と同様の構造に従い、視聴者はヒューマン ピクチャ イン ピクチャ (PiP)、ヒューマン フルスクリーン、AI アバター PiP、AI アバター フルスクリーン、オーディオ ビジュアライザを備えたバージョンの 5 つの形式で提示された同じ中心的な教育トピックを視聴しました。
この研究では、最近教育ビデオを視聴した英語圏数カ国のフルタイム労働者を対象としました。作品の品質、再視聴の意図、自信、学習定着率に対する反応を測定しました。
すべての形式において視聴者の 92% 以上がその動画をプロフェッショナルだと評価し、同じクリエイターの別の動画も見ると回答しました。 また、特別な支援なしで手順を完了できるという自信も感じました。
これは重要なベースラインを設定します。AI アバターを使用しても、自動的にビデオが安っぽく見えたり、信頼できないものになったりするわけではありません。制作の品質が安定している場合、学習者は人間主導のビデオと同じようにコンテンツに取り組み、信頼します。
AI アバターが学習を強化するとき (そしてピクチャ イン ピクチャが役立つ理由)
AI アバターに関しては、少ないほど良いことができます。 私たちの調査では、アバター PiP 形式が最も高い学習保持率をもたらし、視聴者の約 76% がクイズの質問に正解しました。これは他の形式よりも約 10 ポイント高かったです。 そして、数分前に巻き戻しできない 43 秒のビデオを視聴した後でも、そうしました。
PiP は、画面上のコンテンツを前面と中央に保ちながら、画面上に小さなガイドを提供します。アバターは圧倒されることなく表示されるため、学習者はステップに集中し、プロセスを通じてガイドされていると感じることができます。
ステップバイステップの、画面を多用するトレーニングの場合、アバター PiP が強力なデフォルトの選択肢です。 Camtasia などのツールを使用すると、このレイアウトを簡単に構築でき、メイン画面をクリアで読みやすいままにしながら、アバターを小さなフレーム内に配置できます。
AI アバターが気を散らすとき (そしてサイズが重要な理由)
AI アバターはデフォルトでは邪魔になりませんが、サイズは重要です。アバターが画面いっぱいに表示されると、視聴者はリップシンクの問題、アイコンタクト、顔の動きの制限、ぎこちないまばたき、不自然な呼吸などのロボットの特徴に気づく可能性が高くなります。
これらのフルスクリーン形式では、より多くの参加者がアバターを AI として正しく識別しました。 その余分な精査により、注意はタスクやコンセプトからアバター自体へと移ってしまいます。深刻なトピックの場合、これにより、その体験が不気味で不快に感じられる可能性があります。
AI アバターを小さく、二次的なものにしておくことが、ほとんどの教育ビデオに適しています。ピクチャー・イン・ピクチャーのレイアウトや小さなフレームを使用すると、アバターは画面を占有することなく、ガイダンスと臨場感を提供できます。
トレーニング コンテンツにおける AI アバターの適切な使用例
すべてのビデオ形式が AI アバターから同等に恩恵を受けるわけではありません。私たちの調査では、視聴者は教育的な画面ベースのコンテンツの AI アバターに最も快適でした。 CEO の歓迎ビデオやチームの最新情報ビデオなど、個人的な存在が期待される場合、彼らは最も快適ではありませんでした。 最良の結果を得るには、アバターの使用を特定のユースケースに合わせて意図的に調整してください。
使用する AI アバター 対象:
- ソフトウェアのチュートリアルとチュートリアル
- 画面上の手順と密接に連携したプロセス トレーニング
- 個人的な存在よりも一貫性が重視される大規模な更新
人間のプレゼンターを次の目的で使用します。
- リーダーシップ メッセージと変革コミュニケーション
- 感情的なニュアンスや信頼が必要なデリケートなトピック
- 実際のマネージャーやリーダーに会えることが重要なチームの最新情報
Camtasia Audiate のようなツールを使用すると、チームは AI アバターと画面録画を組み合わせて、効率的で魅力的なトレーニング コンテンツを作成しながら、信頼性が重要な人間主導のビデオをキャプチャできます。
AI を活用したトレーニング ビデオのエンゲージメントを測定する方法
AI がトレーニング ビデオの作成方法を変えるのであれば、学習者のエンゲージメントを評価する方法にも影響を与えるはずです。コア指標は AI フォーマットでも非 AI フォーマットでも同じです。
- 完了率とドロップオフポイント
- 重要なセクションの動作を再確認する
- クイズの成績と質問レベルの分析
- フィードバック アンケートまたは簡単なアンケート
変化するのは比較です。単一のバージョンを個別にレビューするのではなく、AI と人間主導の形式を並べて評価し、定着率と学習者の感情がどのように異なるかを確認できます。 AI 対応のワークフローが、チームがより頻繁に関連性のある更新を公開するのに役立つかどうかを追跡することもできます。
まずは小さな実験から始めましょう。価値の高いモジュールを 1 つまたは 2 つ選択し、人間の音声と AI 音声の両方のバージョン、または人間のプレゼンターと AI アバターの PiP バージョンの両方を作成し、数週間にわたって完了とクイズの結果を測定します。
Camtasia を使用して次のトレーニング ビデオを作成します
画面またはカメラを録画します。次に、ビデオエディターを使用して、洗練さと明瞭さを追加します。
さらに詳しく
AI がどのようにトレーニング コストを削減し、コンテンツ更新をスケールするか
AI の音声とアバターを使用すると、直接的な節約と運用の柔軟性の向上が実現します。
直接的な節約には以下が含まれます:
- (スタジオで)ボイスオーバー録音にかかる時間を削減する
- スクリプトを少し変更した後でも、動画全体を再録画する必要はありません
- ローカライズ版を作成するための限界コストの削減
間接的な利益には以下が含まれます:
- プロダクトやポリシーの更新に対する迅速な対応
- 大規模なトレーニング カタログを最新の状態に維持できる機能
AI は手を抜くのではなく、生産のボトルネックを解消します。チームはその時間と予算を、より優れたビジュアル デザイン、より強力なシナリオ、より明確なフィードバック ループ、より頻繁なアップデートに再投資できます。
人間、AI 音声、AI アバターを選択するための実践的なガイドライン
適切な形式はビデオの目的によって異なります。このクイック意思決定ガイドを使用してください:
- 画面を多用する、手続き型の、頻繁に更新されるコンテンツ :高品質の AI 音声と画面録画、さらに PiP のオプションの AI アバター。
- 感情的に敏感なコンテンツ、文化を背景にしたコンテンツ、またはリーダーシップ主導のコンテンツ :人間の声を持つ人間のプレゼンター。
- 概念を重視した長文学習 :ミックス — AI 音声のマイクロレッスンと復習によってサポートされる、核となるアイデアのための人間主導のモジュール。
形式に関係なく、いくつかの原則が常に適用されます。 AI か人間かを問わず、あらゆる音声に高品質の基準を設定します。速度、規模、一貫性が最も重要な場合には AI を使用します。新しい形式を定期的に試験運用し、学習者のフィードバックを収集します。
Camtasia エコシステム内で、チームはレイアウトやペースを調整したり、ボイスオーバーやナレーションに AI 音声ツールやアバター ツールを使用したりできます。
私たちの調査によると、品質が高く、形式がタスクに適合している場合、学習者は AI の音声とアバターに慣れています。
今後の現実的な方法は、小規模から始めてデータドリブンを続けることです。強力なシーンベースの指導に裏打ちされた、1 つまたは 2 つのインパクトの強いチュートリアルと、高品質の AI 音声またはアバター PiP を組み合わせて、学習者がどのように反応するかを確認します。途中で完了、維持、感情を追跡し、AI または人間の存在が最も意味のある場所を調整します。
実験する準備ができたら、Camtasia はトレーニング コンテンツをより迅速に、より一貫性をもって構築、改良、拡張するためのツールを提供します。
始める準備はできましたか? Camtasia を使用して次のトレーニング ビデオを作成します と。
よくある質問
トレーニング ビデオでは、AI の音声は人間のナレーションと同じように機能しますか?
AI 音声に関する調査では、音声が AI か人間かということよりも、音声の品質が重要でした。クイズのスコアは、AI 音声を使用したビデオを視聴した視聴者の方がわずかに優れていました。高品質の AI 音声は最も強力な記憶保持結果をもたらしましたが、低品質で明らかに合成された音声は気が散りやすく、学習者が AI であると認識しやすくなりました。
AI アバターは深刻なトピックや複雑なトピックに対して気が散りすぎますか?
デフォルトではありません。すべてのアバター形式は、プロフェッショナリズム、再視聴可能性、および学習者の自信に関して非常に高いスコアを獲得しました。アバターが画面いっぱいに表示され、視聴者がロボットの顔の特徴を容易に確認できるようになって初めて、気が散ることが問題になりました。本格的または複雑なトレーニングの場合、データはピクチャ イン ピクチャ レイアウトでアバターを小さく保ち、人間のプレゼンターのために全画面形式を予約することをサポートします。
トレーニング コンテンツで AI 音声またはアバターを使用する場合、開示する必要がありますか?
英語圏の回答者は一般に、AI の音声またはアバターが使用された場合の開示を好みました。通常、信頼を維持するには、「AI 音声によるナレーション」などの簡単なメモで十分です。特に AI ナレーションを大規模に展開する場合、開示は主に透明性を考慮した選択です。
AI の音声とアバターが学習に及ぼす影響をどのように測定すればよいでしょうか?
完了率、ドロップオフ ポイント、再視聴行動、クイズのパフォーマンス、簡単なフィードバック アンケートなど、すでに信頼しているものと同じエンゲージメントと維持の指標を使用します。 AI 形式を使用すると、人間の音声バージョンと AI 音声バージョンを比較するなど、どちらのパフォーマンスが優れているかを確認するなど、A/B テストの実行が容易になります。
トレーニング カタログの中で AI の音声とアバターが最も意味をなすのはどこですか?
最も適しているのは、明確さと一貫性が重要な、画面を多用する手続き型のコンテンツです。高品質の AI 音声と画面録画、およびオプションのアバター ピクチャ イン ピクチャは、ウォークスルー、プロセス トレーニング、頻繁なアップデートに適しています。リーダーシップ メッセージ、文化コンテンツ、感情的なニュアンスが必要なトピックには、依然として人間のプレゼンターの方が適しています。
AI 形式を使用すると、トレーニングの個人的な印象や信頼性が薄れますか?
それは使い方次第です。オーディオとビジュアルが高品質で、フォーマットがユースケースに適合している場合、学習者は AI 動画をプロフェッショナルと評価し、同じクリエイターの動画をもっと見ると答えました。信頼が低下する傾向があるのは、人々が実際に人間の存在を期待している場所で AI が使用されている場合、またはアバターや音声が明らかに人工的に見えたり聞こえたりする場合に限られます。