
音声の明瞭度の低さは、映画やテレビの視聴者から最も多く寄せられる不満の一つです。研究によると、視聴者のほぼ半数が字幕付きで視聴することを好むとされています。数時間、あるいは数日にわたって同じシーンの音声編集に携わる音声エンジニアは、同じ台詞を数百回も聴いているので、初めて聴く人にとっての音声の聴き取りやすさを予測することは、大きなチャレンジです。DialogCheckは、会話の明瞭度を客観的に測定するためのツールです。
DialogCheck は、Fraunhofer IDMT が開発した「Listening Effort」テクノロジーと、NUGEN Audio の象徴的な VisLM ラウドネスメーターから着想を得たヒストリービューを融合したものです。Netflix と共同で開発した、デュアル AI ニューラルネットワークを搭載したこのプラグインは、オーディオエンジニアがダイアログのミキシングについて情報に基づいた意思決定を行うための、明確で直感的なデータを提供します。
ダイアログの明瞭度に悪影響を与える要因の多くは、オーディオエンジニアが制御できないものである場合もあります。聞き手が理解できない言語や方言、発音が不明瞭、聞き手の聴覚や環境にも左右されます。
しかし、私たちがコントロールできる要因もあります。ダイアログの音量、他のオーディオ(音楽やバックグラウンドノイズなど)の音量、オーディオの品質、リバーブやその他のエフェクトの使用などです。これらの要因による悪影響を可能な限り軽減すれば、私たちのコントロールの及ばない要因も軽減できるでしょう。
ポストプロダクション・エンジニアのコントロールの及ばない要因と、コントロールの及ぶ要因は、すべてNetflixのTechBlogで「ダイアログの整合性パイプライン」と呼ばれているものに分類されています。
DialogCheck は、自動音声認識と心理音響モデリングを研究している、Fraunhofer IDMT のオルデンブルク支社が開発した技術を実装しています。LE-Meter は、体系的な聴覚テストによって検証されており、その測定値は、聴覚の負担に関する主観的な評価と高い相関関係があります。
- デュアルAIニューラルネットワークを搭載
- 最大7.1.4チャンネルに対応
- リアルタイム・バーメーター
- タイムコード同期履歴表示グラフ
- リアルタイム・モーメンタリー・クラリティー表示
- クラリティーの中央値表示
- ユーザー定義可能な上側と下側の色分割表示
主な特長
Dialog Checkはリアルタイムのバーメーターと履歴グラフを表示することで、編集者は再生中の音声とダイアログ明瞭度測定値を簡単に比較し、音声の明瞭度が低く、初めて聴く人にとって理解しにくい可能性のあるセクションを特定できます。分布を示すグラフとクリップ全体に対する数値の統計値を組み合わせることで、編集者はプログラム全体の音声の明瞭度を迅速に把握できます。

緑色の表示は、明瞭な音声であることを示します。緑色が濃いほど明瞭です。黄色の表示は、おそらく明瞭でない音声であることを示します。黄色が濃い(または赤に近い)部分ほど、音声の明瞭度が低下していることを示しており、場合によってはその部分の明瞭度を向上させる必要がある場合があります。履歴のトレースとレベルメーターがグレーで表示されている場合、DialogCheckはその部分には会話が含まれていないと判断しています。これは無音、効果音、音楽、または一部のケースでは、DialogCheckが会話として認識できないほど不明瞭な音声である可能性があります。
- 映画
- テレビ
- ラジオ
- ポッドキャスティング
- ゲーム