音声信号の圧縮

300Hz~3KHzの帯域の音声信号をそのままデジタル化して送ると、アナログFMと比べて4倍以上にも帯域が広がって電波の利用効率が極端に悪くなることが分かりました。そこで、この効率を上げることを考えてみます。

人の音声を聞くと、他の動物の鳴き声や騒音等とは違って、まだ一度も会ったことのない人の声でもすぐに人の音声であることが分かります。

これは、音声信号には周期性やスペクトルに特徴があるからです。SSBの信号で、初めて交信する人でも正確にチューニングできることも同様な理由です。図1のように正確にチューニングできていると、基本となる音声の周波数とその高調波の関係が正確に整数倍になりますが、もしチューニングがずれているとこのようになりません。

図1 SSBのチューニングでの音声の周波数関係

音声信号にはこのように特徴があるため、音声帯域にある情報をすべて送らなくても元の音声が再生できるのではないかと考えるのが音声信号の圧縮です。この圧縮の方法は、線形予測(Linear Prediction Speech Model系) と言う手法を元にしたCELP(Code Excited Linear Prediction)、RELP(Residual Excited Linear Prediction)、VSELP(Vector Sum Excited Linear Prediction)、AMBE(Advanced Multi-Band Excitation)等色々な方式がありますが、要点として「送らなくても済む情報は送らない」と言うことです。

このような方式についての説明は非常に専門的で分かりにくく、これだけで一冊の本になってしまうのでここでは要点だけに止めます。携帯電話に使われているVSELPでは、図2のように通信している両側の端末にテーブルを持っています。このようにすれば送る情報が減少するため、信号の圧縮ができることになります。

図2 VSELPの送り方

音声信号を効率よくデジタル化するCODEC(Coder-Decoder) には普通信号の圧縮も含まれていますが、最初にデジタル化する過程はこれまで述べてきた方法とほぼ一緒です。

D-STARで使われているCODECの1つはITU勧告G723.1と言う規格です。これはACELP(Algebra Code Excited Linear Prediction) と言う方式が使われ、出力として規格上は6.3Kbpsと5.3Kbpsがありますが、できるだけ効率化するため低速の5.3Kbpsを採用しています。この規格はインターネットの音声CODECとして組み込まれていてインターネットとの共通性があるものです。

5.3Kbpsまで圧縮されると、そのまま変換した64Kbpsの1/10以下となり、そのままデジタル変調しても従来のアナログFMの占有周波数帯幅16KHzの半分近くの8.4KHz程度まで占有帯域幅を狭くすることができます。

D-STARでは、これ以外に狭帯域音声通信用としてAMBE方式を採用しています。これは驚異的な圧縮方法で3KHzまでの音声信号をそれより低い2.4Kbpsまで落とすことができます。この方式はアメリカのDVSI(Digital Voice System Inc.) 社によって開発され、一般的にこのCODECのICを購入可能ですが、詳しい技術内容は公開されていません。

CODECの方式と占有周波数帯幅

このCODECの出力をそのままデジタル変調(GMSK)しても、今まで一番狭帯域の音声通信とされているSSBとほぼ同等の占有帯域幅で通信することができ、電波の有効利用に大きく貢献することができます。これをQPSK変調すると、占有帯域幅が1.7KHzまで狭帯域にすることができ、SSBより遙かに狭いデジタル音声通信が可能となります。

画像信号の圧縮

D-STARではインターネットと共通性があるため、基本的にインターネットの信号を送受することができることは既に述べた通りです。従って画像信号も送受できますが、D-STAR独自の処理は行わず、インターネットのプロトコルに準じた取り扱いになっています。

画像信号もそのまま送るとデータ量が多くなり、送受信の時間がかかるため信号の圧縮をして送ると効率がよくなります。画像の圧縮の方法も色々ありますが、基本的なことを考えてみます。話を簡単にするため、カラーではなくモノクロで考えると、図4のように画像を構成する黒とバックの白になっていますが、仮に白を0、黒を1とすると、そのままの送る場合は黒が10個続くと、1、1、1、1、1、1、1、1、1、1と送ることになりますが、単に「1が10個」と送ってもよいことが分かります。10個程度ではそれほど効率が変わりませんが、数10、数100と並ぶと相当変わってきます。

図4 画像の送り方

結局画像の圧縮も音声と同様で「送らなくても済むものは送らない」と言うことが基本になります。実際にはカラーでありもっと複雑な処理になりますが考え方は同じです。

Windowsの画像処理でビットマップ・ファイルをJpegに変換すると容量が格段に少なくなるのは既に多くの人が経験済みのことと思います。