MP3がなくなったので、どのオーディオコーデックが新しい標準になる準備ができていますか?圧縮、最新のオーディオコーデック、およびオーディオの将来について話しましょう。
2017年に、フラウンホーファー研究所が保有していたMP3の特許は失効しました。 2018年が始まるにつれ、ますます多くのメーカーがコーデックのサポートを利用しています。 MP3形式は、最も広く知られているオーディオコーデックの1つであり、デジタルオーディオの世界の爆発的な拡大の主な原因でした。
MP3がなくなった今、新しい業界標準になるのに最適なコーデックはどれですか?
この記事では、コーデックの基本を調べ、今日の有名なオーディオ形式を見て、最後に今後数十年のオーディオコーデックを推測的に調べます。
コーデックはencode/decodeの略です。それらはハードウェアまたはソフトウェアである可能性があります—両方ともアナログ信号入力を受け取り、それをデジタル形式に変換します。デコード機能はまったく同じプロセスですが、デジタルデータストリームをアナログ音波に変換して出力できるように逆になっています。
コーデックには、非圧縮、非可逆、可逆の3つのカテゴリがあります。
- 非圧縮: 非圧縮オーディオファイルは、完全なオーディオ入力信号を、着信データの全負荷を保存できるデジタル形式にエンコードします。これらは、大きなファイルサイズと高い遅延(非リアルタイム再生)を犠牲にして最高の品質とアーカイブ機能を提供し、多くの場合、それらの広範な使用を禁止します。
- 不可逆: 非可逆ファイルは、非圧縮ファイルとは異なる方法でエンコードされます。アナログからデジタルへの変換の本質的な機能は、不可逆符号化技術でも同じです。非可逆は、入力音波の周波数がほぼ同様のデジタル値にサンプリングされるため、非圧縮から発散します。これらの可能なすべてのデジタル値の合計は、コーデックにビット深度と呼ばれるものを提供します。コーデックのビット深度(最も一般的には16ビットまたは24ビット)は、サウンドが「量子化」される精度を決定します。これは、着信音波を最も近い値に丸めるために使用されるサンプリングのプロセスです。非可逆コーデックは、元の音波に含まれるかなりの量の情報を破棄します。このため、非可逆オーディオファイルは非圧縮ファイルよりもはるかに小さく、低遅延の再生を提供し、ライブオーディオシナリオで使用できます。
- ロスレス: ロスレスエンコーディングは、非圧縮と非可逆の中間にあります。大幅に縮小されたサイズで非圧縮と同様のオーディオ品質を実現します。ロスレスコーデックは、デコード時に非圧縮情報を復元する前に、エンコード時に非破壊的な方法で着信オーディオを圧縮することでこれを実現します。
フォノトグラフでの1860年の最初の既知のオーディオ録音以来、オーディオ録音および再生技術は常に流動的な状態にあります。 20世紀は、プロのサウンドレコーダーとエンジニアの時代、電波を介したオーディオの送信の時代、オーディオの品質とテクノロジーの大幅な進歩、オーディオ業界の継続的な成長、そして一般的な貿易をもたらしました。
1982年、オーディオの世界は、初のデジタルオーディオフォーマットであるコンパクトディスクで、新しいミレニアムへの第一歩を踏み出しました。画期的なパルス符号変調(PCM)テクノロジーに基づいて構築された、CDは、アナログ音波をサポートされている最も近いデジタル値に「量子化」することにより、デジタル値として保存することができました。
パルス符号変調は、デジタルオーディオフォーマットの革新の新時代を引き起こしました。 10年以内に、MP3やWAVなどの認識可能な最新のコーデックが注目を集めていました。 2000年代初頭には、大きなファイルサイズを犠牲にすることなく、デジタル品質をさらに高めるロスレスオーディオコーデックの最初の波が見られました。
しかし、これらの優れたフォーマットは、00年代初頭のMP3プレーヤーの流行に備えていませんでした。 AppleのiPodは大衆をデジタルオーディオの世界にもたらし、MP3は世界中のオーディオ再生の標準となりました。
MP3の死に伴い、どのコーデックがその代わりになるのに最適な態勢を整えていますか?現代のテクノロジーは、将来のオーディオコーデックの可能性にどのような可能性をもたらしますか?
今日、無数の業界で頻繁に使用されているオーディオコーデックが多数あります。このリストのエントリの多くは数十年前に導入されましたが、オーディオコーデックの将来が持つ可能性に光を当てる新しいコーデックがいくつかあります。
- AMR — Adaptive Multi-Rate: AMRコーデックファミリは、世界で最も一般的に使用されているオーディオ形式の1つです。これは主に、携帯電話の事実上のオーディオ標準であるためです。 AMRは音声用に最適化されています。つまり、AMRは低品質、低帯域幅、低遅延のコーデックです。 AMRは、音楽や高品質のオーディオ録音または再生用に開発されたものではありません。
- FLAC —完全ロスレスオーディオコーデック: FLACは多くの人からMP3のより良いバージョンであると考えられています。ファイルを非常に小さいサイズに圧縮し、オーディオ品質を損なうことなく圧縮します。 FLACファイルは非常に軽量で用途が広く、MP3を再生できるすべてのデバイスで再生できます。そして、それはオープンソースであり、私の本であらゆる種類の賞を受賞しています。特に、コーデックとその機能のサードパーティによる実装です。
- WAV —波形オーディオファイル形式: 一般にWAVと短縮されるWaveformAudioFile Formatは、ほぼ30年にわたって業界の主力製品でした。その粘着力の秘訣は、コーデックのシンプルさと耐久性です。 WAVは通常、トランスコーディングを必要とせずに、最高品質の非圧縮オーディオの一部を提供します。その安定性は、破損または破損したWAVファイルが引き続き再生されることを意味します。
- ALAC — Apple Losslessコーデック: 2004年にリリースされたAppleLosslessCodec、またはApple Losslessは、最大32ビット深度で最大サンプルレート384kHzの8チャンネルのオーディオをサポートします。 2011年、AppleはALACをオープンソースでロイヤリティフリーにしました。
- AAC — Advanced Audio Coding: AACは、MP3圧縮の背後にいる同じエンジニアであるフラウンホーファー研究所によって作成されました。今年初めにMP3の有効期限が切れたため、フラウンホーファー研究所は代替コーデックとしてAACを推奨しています。 AACは不可逆形式であり、その主なセールスポイントは、同じビットレートでのMP3よりも大幅に高い音質です。
- DSC — Direct Stream Digital: DSDは、独自の高品質オーディオコーデックです。 DSDの背後にある基盤となるテクノロジーは、他のほとんどのコーデックに見られる標準のパルス符号変調とは少し異なります。 DSDは、パルス密度変調エンコーディングを採用しており、ビットストリームの解像度を下げ、サンプルレートを1秒あたり280万回に増やして、オーディオ信号を生成します。 DSDはオーディオの世界での使用が制限されており、主に特殊なハードウェアで再生されるオーディオファンのコーデックとして機能します。
- オーパス: Opusは、このリストを作成するための最新のコーデックです。 2012年にリリースされ、以前は複数あった複数のアプリケーションの単一の標準として機能するように開発されました。 Opusは、現代世界のニーズを念頭に置いて作成されました。その哲学の中心は、ネットワーク通信やライブ音楽パフォーマンスに適した高品質で低遅延のオーディオです。そのレイテンシーは5ミリ秒まで短縮できます—他のほとんどのコーデックは、比較すると、100ミリ秒のレイテンシーをほとんど提供できません。
毎年、新しいコーデックテクノロジーの新しいバリエーションとフレーバーがもたらされますが、大量オーディオ配信の新しい標準で何を探す必要がありますか?
今日から選択できる無数のフォーマットは圧倒されるかもしれませんが、コーデックへの期待を設定し始める時が来ています。最近およびより遠い過去のコーデックから学ぶことはたくさんあります。 WAVの信頼性の高いシンプルさとユニバーサル機能、FLACの完全ロスレスオープンソースモデル、音声と一般的なオーディオに対するOpusの最適化—テクノロジーは根本的に変化したので、なぜコーデックを使用すべきではないのですか?
理想的な将来のオーディオコーデックで私が探しているものは次のとおりです。
- 安全: 最新のセキュリティおよび暗号化テクノロジーをすべて利用します。
- 開く: オープンソースで完全に文書化されています。
- ユニバーサルサポート: 新しいハードウェアやソフトウェアを必要とせずに、記録および再生できます。
- 完全にロスレス: 軽量で高品質。
- 多目的: 音声および一般的なオーディオの使用に最適化されています。
- 高解像度: 可能な限り最高の録音解像度のサポート。
これらの理想的なパラメータのほとんどは今日のコーデックに存在しますが、これらの仕様すべてを意味のある方法で統合した単一のコーデックはありません。未来がよりオープンで、より使いやすく、より機能的で、起動するのに最適なサウンドになることを願っています。
今後10年間で、限界を押し広げるオーディオコーデックがより一般的になるでしょう。エンコードとデコードの基盤となるテクノロジーは進歩し、進化し、他の科学や分野と融合します。
オーディオの世界で再び単一の「業界標準」コーデックが見られるとは思えません。オーディオフォーマットは、ビデオコーデックとほぼ同じようにニッチに発展し続けると予測しています。これにより、使いやすさとタスクの専門性が向上し、オーディオパイプラインの合理化が大幅に向上します。
何が起こっても、オーディオの制作と再生の技術的バックボーンは調整のために遅れています。現在の傾向が維持されれば、10年後にはオーディオの世界が認識できなくなる可能性が高くなります。