10 信源编码

10.1 概论

模拟信号：信号参量的取值是连续的或取无穷多个值的称为模拟信号

数字信号：信号参量只能取有限个值称为数字信号

信源编码：

作用：压缩编码、模/数转换（A/D转换）
A/D转换技术：波形编码、参量编码

波形编码：

三个步骤：抽样、量化、编码
常用方法：脉冲编码调制PCM、差分脉冲编码调制DPCM、增量调制$\Delta M$

波形编码的三个步骤

10.2 模拟信号的抽样

抽样定理：任何模拟信号数字化的理论基础

10.2.1 低通模拟信号的抽样定理

低通模拟信号的抽样定理：一个最高频率小于$f_H$的低通信号$m(t)$，可由其等间隔的抽样值唯一确定，抽样间隔$T_s$或抽样速率$f_s$应满足$T_s\leq \frac{1}{2f_H}$或$f_s\geq 2f_H$

如果以$f_s=2f_H$的速率进行均匀抽样，则由抽样序列$m(nT_s)$能够无失真地恢复出$m(t)$
理想抽样过程的波形和频谱：无混叠
混叠失真
重建原信号：将$M_s(f)$通过截止频率为$f_H$的理想低通滤波器，即可取出原信号

抽样及恢复原理框图

奈奎斯特间隔 & 奈奎斯特速率：

奈奎斯特间隔：$T_s=\frac{1}{2f_H}$
奈奎斯特速率：$f_s=2f_H$

无混叠

混叠失真

10.2.1 带通模拟信号的抽样定理

带通模拟信号的抽样定理：设带通模拟信号频带在$f_L\sim f_H$之间，信号带宽$B=f_H-f_L$，则此带通信号所需最小抽样速率为$f_s=2B(1+\frac{k}{n})$，n为$(f_H/B)$的整数部分，k为$(f_H/B)$的小数部分

$f_L=0$时，等同于低通抽样
当$f_L$很大时，为高频窄带信号，$f_s\approx 2B$

10.3 模拟脉冲调制

冲激函数时理想多样的，但是实际的抽样脉冲的宽度和高度是有限的

模拟脉冲调制分类：

脉冲振幅调制PAM
脉冲宽度调制PDM
脉冲位置调制PPM

模拟脉冲振幅调制PAM：PAM是脉冲序列的幅度虽则$m(t)$变化的一种模拟脉冲调制方式

事实上，抽样的结果就是一个PAM信号
PAM是模拟信号数字化的必经之路
抽样信号频谱：$M_s(f)=\frac{1}{T_s}\sum_{n=-\infty}^{\infty}M(f-nf_s)$
抽样分类：
理想抽样：抽样脉冲序列为理想的冲击脉冲序列
实际抽样：抽样脉冲具有一定宽度和有限高度
- 自然抽样、平顶抽样

自然抽样：样值脉冲幅度随着原信号$m(t)$的幅度而变

产生：用基带模拟信号对脉冲载波进行调幅
恢复：低通滤波器
频谱：$M_s(f)=M(f)*S(f)=\frac{A\tau}{T_s}Sa(\pi n \tau f_s)M(f-nf_s)$

自然抽样波形与频谱

自然抽样的产生与恢复

平顶抽样：每个脉冲值的顶部都是平坦的

产生：将模拟信号与非常窄的周期性脉冲相乘，然后通过一个保持电路，将抽样电压保持一段时间
恢复：修正+低通滤波器
频谱：$M_H(f)=\frac{1}{T_s}\sum_{n=-\infty}^{\infty}H(f)M(f-nf_s)$

平顶抽样的产生

平顶抽样的恢复

10.4 抽样信号的量化

10.4.1 量化原理

量化：用有限个量化电平表示无限个抽样值

模拟信号抽样称为时间离散信号，但仍然是模拟的

量化原理

10.4.2 均匀量化

均匀量化：等间隔划分输入信号取值域

均匀量化

信号量噪比：信号功率与量化噪声之比

模拟抽样信号取值：$[a,b]$
量化间隔：$\Delta v=\frac{b-a}{M}$
量化区间端点：$m_i=a+i\Delta v$
量化输出电平：$q_i=\frac{m_i+m_{i-1}}{2}$
量化噪声功率：$N_q=E[(m_k-m_q)^2]=\int_a^b(m_k-m_q)^2f(m_k)dm_k=\sum_{i=1}^{M}\int_{m_{i-1}}^{m_i}(m_k-q_i)^2f(m_k)dm_k$2
抽样值$m_k=m(kT_s)$，量化信号值$m_q=m_q(kT_s)$，M为量化电平数，$m_i=a+i\Delta v$，$q_i=a+i\Delta v-\frac{\Delta v}{2}$
信号$m_k$平均功率：$S=E(m_k)^2=\int_a^b x^2f(x)dx$
信号量噪比：$\frac{S}{N_q}=\frac{E(m_k)^2}{E[(m_k-m_q)^2]}$

均匀量化器的小结论：一个均匀量化器的量化电平数为M，输入信号的抽样值在$[-a,a]$区间具有均匀的概率密度，则该量化器的量化信噪比为$\frac{S}{N_q}=M^2=2^{2N}$，其中$M=2^N$

$(\frac{S}{N_q})_{dB}=10\lg(2^{2N})\approx 6N (dB)$

10.4.3 非均匀量化

非均匀量化：信号抽样值小，则量化间隔小；信号抽样值大，则量化间隔大

实现：将信号抽样值压缩后进行均匀量化
小抽样值被放大，大抽样值被压小
恢复：采用与压缩器特性相反的扩张器将信号进行扩张
优点：
当输入量化器的信号具有非均匀分布的概率密度时，非均匀量化器的输出端可以得到较高的平均信号量噪比
非均匀量化时，量化噪声功率均方根基本与信号抽样值成比例，改善了小抽样值时的量噪比

A律与$\mu$律：

A压缩律——13折线近似法（中国大陆、欧洲以及国际互联时）
$\mu$压缩律——15折线近似法（北美、日本、韩国等少数国家）

A压缩律：

\[
y=\begin{cases}
  \frac{Ax}{1+lnA} & 0 \leq x \leq \frac{1}{A} \\
  \frac{1+\ln Ax}{1+lnA} & \frac{1}{A} \leq x \leq 1 \\
\end{cases}
\]

A：常数，决定压缩程度
A=1，无压缩效果
实际常用A=87.6，使压缩特性曲线再原点附近斜率为16
x：压缩器归一化输入电压 => $x=\frac{压缩器输入电压}{压缩器可能的最大输入电压}$
y：压缩器归一化输出电压 => $y=\frac{压缩器输出电压}{压缩器可能的最大输出电压}$

13折线压缩特性：（A律的近似）

13折线压缩特性

13折线与A律

$\mu$压缩律与15折线压缩特性：

15折线压缩特性

$$\mu$压缩律与15折线压缩特性$

10.5 脉冲编码调制

脉冲编码调制：将模拟信号的抽样量化值变成二进制信号，是模拟信号数字化方法之一

过程：抽样、量化、编码
常用二进制码：
自然二进制码：编码简单，译码可以逐比特独立进行
折叠二进制码：简化编码过程，误码对小电压影响小
格雷码：相邻码字距离恒为1
PCM编码采用非均匀量化8位折叠码

PCM原理框图

常用二进制码

常用二进制码的位数与其他参数

A律13折线PCM编码：正负各8段，每段16个量化级，共256个量化级

编码组成：
$C_1$极性码：表示样值的极性，正1负0
$C_2C_3C_4$段落码：表示样值幅度所在段落
$C_5C_6C_7C_8$段内码：对应段内的16个量化级
为了确定样值的幅度所在段落和量化级，必须知道段落的起始电平和各段内的量化间隔

量化间隔与电平范围

PCM系统中噪声的影响：量化噪声 & 加性噪声

加性噪声：$\frac{S_o}{N_a}=\frac{M^2}{2^{2(N+1)}P_e}$
量化噪声：$\frac{S_o}{N_q}=M^2=2^{2N}$
总输出信噪比：$\frac{S_o}{N}=\frac{2^{2N}}{1+2^{2(N+1)}P_e}$
大信噪比：$2^{2(N+1)}P_e<<1$，$\frac{S_o}{N}\approx 2^{2N}$
小信噪比：$2^{2(N+1)}P_e<<1$，$\frac{S_o}{N}\approx \frac{1}{4P_e}$

10.6 差分脉冲编码调制

预测编码：每个抽样值不是独立地编码，而是先根据前几个抽样值计算一个预测值，再取当前抽样值和预测值之差，将此差值编码并传输

线性预测：前几个抽样值的线性组合
差分脉冲编码调制DPCM：仅使用前面的一个抽样值预测当前抽样值

10.7 增量调制

增量调制原理：当DPCM中量化器的量化电平数取2时，即为增量调制系统

量化噪声：译码器恢复的信号与编码输入模拟信号的波形之间存在失真
一般量化噪声：编码和译码时使用阶梯波形近似，因此这是增量调制的基本量化噪声，且伴随信号永远存在
过载量化噪声：发生在输入信号斜率绝对值过大的情况下
阶梯波的最大可能斜率（译码器最大跟踪斜率）：$k=\frac{\sigma}{T_s}=\sigma f_s$
$\sigma$为量化台阶，$f_s$为抽样频率
若增大量化台阶，则会增大基本量化噪声，所以需要增大抽样频率避免过载量化噪声
最大信号量噪比：$\frac{S_{max}}{N_q}=\frac{3}{8\pi^2}(\frac{f_s^3}{f_k^2f_m})\approx0.04\frac{f_s^3}{f_k^2f_m}$

增量调制原理

10.8 时分复用

时分复用TDM：利用抽样的间隔时间传输多路抽样信号

优点：便于实现数字通信、易于制造、适用采用集成电路实现、生产成本低
TDM & FDM：
TDM：各路信号在时域分开，频域混叠
FDM：各路信号在频域分开，时域混叠
时分制多路电话通信系统，ITU制定了两种准同步数字体系 => E体系、T体系

时分复用TDM

10.9 矢量量化

详见教材P312

10.12 数字数据压缩编码

无损压缩、熵编码、等长码、变长码

信源编码、唯一可译码、非奇异性

唯一可译码的两种方式：即时可译码、非即时可译码

信源编码分类

Kraft不等式：对于D元字母表上的即时可译码，码字长度$l_1,l_2,...,l_m$必定满足不等式$\sum_{i=1}^{m}D^{-l_i}\leq 1$

任意唯一可译码的码字长度也必然满足Kraft不等式

最优码：码字的最小期望长度为$L^*=\sum p_il_i=-\sum p_i\log_D p_i=H_D(X)$

最优码的码长满足以下界定定理：$H_D(X)\leq L\leq H_D(X)+1$ => 香农第一定理（无失真信源编码）

霍夫曼编码：无前缀变长码，即时可译码，对给定熵的信源能够达到最小平均码长，是最优码

过程：信源缩减 -> 分配码字

压缩编码性能指标：

压缩比：压缩前每个字符的平均码长与压缩后每个字符的平均码长之比
编码效率：编码后的字符平均信息量（熵）与编码平均码长之比

扩展码：

扩展码