広帯域音声コーデックG.722
ITU-T G.722はCCITT勧告書(Blue Book)にも記載されている、とても歴史の有る広帯域音声コーデックです。
一般の電話音声が3.4kHz帯域であるのに対して、7kHzまでの音声を扱えるため「広帯域」と呼んでいます。
古い規格ではありますが意外に使い勝手が良く、そこそこの圧縮率で処理が軽く、広帯域音声が必要な用途には現役で使われています。
音声以外の信号(音楽など)が扱えるという魅力も有ります。例えば、ちょっとBGMを流したりするのには最適だと思います。
そんなG.722ですが、先日ITU-Tのサイトを見たら大幅な拡張がされていて驚きました。
- 基本的な音質改善
- さらに広帯域化(14kHz帯域)
- 音声ビット長アップ
- ステレオ化
- 浮動小数点バージョン
- PLC
すごいのは全て上位互換で作られていて、例えば「14kHz帯域、ステレオ」で圧縮されたコードデータが、元祖G.722(7kHz帯域、モノラル)で再生出来てしまう所です。
浮動小数点バージョンが有るのでパソコンでも簡単に処理が出来たり、PLCでIP伝送におけるパケットロス対策も出来るようになりました。
これから増々用途が増える気がします。
以下にポイントをまとめておきましたので、ご参照下さい。
G.722(オリジナル)
音声帯域:50Hz〜7kHz(16kHzサンプリング)
ビットレート:64kbit/s、56kbit/s、48kbit/s
音声:モノラル、14ビット
固定小数点演算
Annex A – Testing signal-to-total distortion ratio for 7 kHz audio-codecs at 64 kbit/sRecommendation ITU-T G.722 connected back-to-back.
G.722(標準、64kbit/s)でエンコード/デコードした際の歪を評価するためのテストデータ
Annex B – Superwideband embedded extension for ITU-T G.722
音声帯域:50Hz〜7kHz(16kHzサンプリング)
ビットレート:64kbit/s、56kbit/s
音声帯域:50Hz〜14kHz(32kHzサンプリング)
ビットレート:96kbit/s、80kbit/s、64kbit/s、
音声:モノラル、16ビット
固定小数点演算
Annex C – Floating-point implementation of ITU-T G.722 Annex B
Annex Bの浮動小数点バージョン
Annex D – Stereo embedded extension for ITU-T G.722
ステレオ拡張
音声帯域:50Hz〜7kHz(16kHzサンプリング)
ビットレート:80kbit/s、64kbit/s
音声帯域:50Hz〜14kHz(32kHzサンプリング)
ビットレート:128kbit/s、112kbit/s、96kbit/s、80kbit/s
音声:ステレオ、16ビット
固定小数点演算
Annex E – An alternative implementation of stereo superwideband extension using floating point
Annex Dの浮動小数点バージョン
Appendix
Appendix I – Networking aspects
Appendix II – Digital test sequences
Appendix III – A high-quality packet loss concealment algorithm for ITU-T G.722
Appendix IV – A low-complexity algorithm for packet-loss concealment with ITU-T
Appendix V – Mid-side stereo coding