视频1 视频21 视频41 视频61 视频文章1 视频文章21 视频文章41 视频文章61 推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37 推荐39 推荐41 推荐43 推荐45 推荐47 推荐49 关键词1 关键词101 关键词201 关键词301 关键词401 关键词501 关键词601 关键词701 关键词801 关键词901 关键词1001 关键词1101 关键词1201 关键词1301 关键词1401 关键词1501 关键词1601 关键词1701 关键词1801 关键词1901 视频扩展1 视频扩展6 视频扩展11 视频扩展16 文章1 文章201 文章401 文章601 文章801 文章1001 资讯1 资讯501 资讯1001 资讯1501 标签1 标签501 标签1001 关键词1 关键词501 关键词1001 关键词1501 专题2001
信息论与编码理论-第2章信息的度量-习题解答-20071017
2025-09-30 19:37:07 责编:小OO
文档
第2章  信息的度量

习    题

2.1  同时扔一对质地均匀的骰子,当得知“两骰子面朝上点数之和为5”或“面朝上点数之和为8”或“两骰子面朝上点数是3和6”时,试问这三种情况分别获得多少信息量?

解:

某一骰子扔得某一点数面朝上的概率是相等的,均为1/6,两骰子面朝上点数的状态共有36种,其中任一状态出现都是等概率的,出现概率为1/36。设两骰子面朝上点数之和为事件a,有:

a=5时,有1+4,4+1,2+3,3+2,共4种,则该事件发生概率为4/36=1/9,则信息量为I(a)=-logp(a=5)=-log1/9≈3.17(bit)

a=8时,有2+6,6+2,4+4,3+5,5+3,共5种,则p(a)=5/36,则I(a)= -log5/36≈2.85(bit)

p(a)=2/36=1/18,则I(a)=-log1/18≈4.17(bit)

2.2  如果你在不知道今天是星期几的情况下问你的朋友“明天是星期几”,则答案中含有多少信息量?如果你在已知今天是星期三的情况下提出同样的问题,则答案中你能获得多少信息量(假设已知星期一至星期日的排序)?

解:

设“明天是星期几”为事件a:

不知道今天是星期几:I(a)=-log1/7≈2.81(bit)

知道今天是星期几:I(a)=-log1=0 (bit)

2.3  居住某地区的女孩中有20%是大学生,在女大学生中有80%是身高1米6以上的,而女孩中身高1米6以上的占总数的一半。假如我们得知“身高1米6以上的某女孩是大学生”的消息,求获得多少信息量?

解:

设“居住某地区的女孩是大学生”为事件a,“身高1米6以上的女孩”为事件b,则有:

p(a)= 0.2,p(b|a)=0.8,p(b)=0.5,

则“身高1米6以上的某女孩是大学生”的概率为:

信息量为:I=-logp(a|b)=-log0.32≈1.(bit)

2.4  从大量统计资料知道,男性中红绿色盲的发病率为7%,女性发病率为0.5%,如果你问一位男同志:“你是否是红绿色盲?”,他回答“是”或“否”,问这两个回答中各含有多少信息量?平均每个回答中含有多少信息量?如果你问一位女同志,则答案中含有的平均自信息量是多少?

解:

男同志回答“是”的概率为7%=0.07,则信息量I=-log0.07≈3.84(bit)

男同志回答“否”的概率为1-7%=0.93,则信息量I=-log0.93≈0.10(bit)

平均信息量为:H1=-(0.07×log0.07+0.93×log0.93) ≈0.37(bit/符号)

   问女同志的平均自信息量:H2=-[0.05×log0.05+(1-0.05) ×log(1-0.05)] ≈0.045(bit/符号)

2.5  如有7行9列的棋型方格,若有两个质点A和B,分别以等概率落入任一方格内,且它们的坐标分别为(XA,YA)、(XB,YB),但A、B不能落入同一方格内。

(1) 若仅有质点A,求A落入任一个格的平均信息量。

(2) 若已知A已落入,求B落入的平均自信息量。

(3) 若A、B是可分辨的,求A、B同时都落入的平均自信息量。

解:

若仅有质点A,A落入任一格内的概率均为1/63,则A落入任一个格的平均信息量为:

若已知A已落入,质点B再落入时,它只可能落入其中63-1=62个方格内,则其概率均为p(b|a)=1/62,则B落入的平均自信息量为:

A、B同时都落入的平均自信息量,即为求联合熵H(AB):

2.6  设信源,求这信源的熵,并解释为什么H(X) > log6,不满足信息熵的极值性。

解:

信息熵

    因为,所以变量不止6-1=5个,因此不满足信息熵的极值性。

2.7  有两个二元随机变量X和Y,它们的联合概率为

Y                 X

01
0
1
并定义另一随机变量Z=XY(一般乘积)。试计算:

(1) 和。

(2) 和

(3) 和。

解:

从题意可知,

可得:

由于Z=XY,则有

所以

随机变量X和Z的联合概率分布如下:

X                 Z

01
00
1
由上表将X和Z的联合概率代入联合熵公式,求得:

同样Y、Z的联合概率分布如下:

Y                 Z

01
00
1

和。

2.8  某一离散无记忆信源的符号集为,已知。

(1) 求该信源的信息熵。

(2) 有100个符号构成的序列,求某一个特定序列(例如有m个“0”和(100 – m)个“1”)的自信息量的表达式。

(3) 计算(2)中序列的熵。

解:

(1) 该信源的信息熵为:H=-1/4log1/4-3/4log3/4≈0.81(bit/符号)

(2) 由于为离散无记忆信源,则有

   所以

(3) 

2.9  设有离散无记忆信源S,其概率空间为

设另有一离散无记忆信源,其符号集为信源S符号集的两倍,即A={ai: i=1,2,…,q, q +1,,2q },并且符号的概率分布为:

请写出信源的信息熵与信源S的信息熵的关系。

解:

2.10  设有一概率空间,其概率分布为,并有。若取,,其中,而其他概率值不变。试证明由此所得新的概率空间的熵是增加的,并用熵的物理意义作以解释。

证明: 

法1:

    

物理意义:新概率分布比原概率分布更“均匀”,所以,其熵更大。

法2:设原概率分布的熵为:

则新概率分布的熵为:

其中

由于

所以,f()是单调上升的。因此,

2.11   设有一概率空间,其概率分布为,并有,试证明:

证明:

由熵的递增性:

又由熵的极值性:

因此,

2.12  设有一概率空间,其概率分布为,并有,试证明:

证明:

因为,而,所以在该概率空间中

即等式成立

2.13  证明,并说明等式成立的条件。

证明:

由于条件熵小于或等于无条件熵,条件较多的熵小于或等于条件较少的熵,考虑到平稳性,有,即证

2.14  证明。

证明:

    

当且仅当相互时,等号成立。

2.15  (1) 为了使每帧黑白电视图像获得良好的清晰度和规定的适当的对比度,需要用个像素和10个不同亮度电平,求传递此图像所需的信息率(比特/秒)。并设每秒要传送30帧图像,所有像素是变化的,且所有亮度电平等概率出现。

(2) 设某彩电系统,除了满足对于黑白电视系统的上述要求外,还必须有30个不同的色彩度,试证明传输这彩色系统的信息率要比黑白系统的信息率约大2.5倍。

解:

像素包含的信息量为:

则每帧电视图像所含的信息量为:

则图像所需的信息率为30×1.66×106 =4.98×107bit/s

证明:

2.16  每帧电视图像可以认为是3×105个像素组成,所有像素均是变化的,且每一像素又取128个不同的亮度电平,并设亮度电平等概率出现。问每帧图像中含有多少信息量。若现有一广播员在约10000个汉字的字汇中选1000个字来口述此电视图像,试问广播员描述此图像所广播的信息量是多少(假设汉字字汇是等概率分布,并彼此无依赖)?若要恰当地描述此图像,广播员在口述中至少需用多少汉字?

解:

由于所有像素均是变化的,且每一像素又取128个等概率出现不同的亮度电平,则像素的包含的信息量为: 

而每帧电视图像可以认为是3×105个像素组成,所有像素均是变化的,所以有

汉字所含的信息量为:

所以1000个字所含的信息量:

2.17  为了传输一个由字母A、B、C、D组成的符号集,把每个字母编码成两个二元码脉冲序列,以00代表A,01代表B,10代表C,11代表D。每个二元码脉冲宽度为5毫秒。

(1) 不同字母等概率出现时,计算传输的平均信息速率。

(2) 若每个字母出现的概率分别为pA=1/5,pB=1/4,pC=1/4,pD=3/10,试计算传输的平均信息速率。

解:

因为A,B,C,D四个字母,每个字母用两个码,每个码为5ms, 所以每个字母用10ms,       当信源等概率分布时,信源熵为H(X)=log4=2(bit/符号),则平均信息传递速率为:

则平均信息传递速率为:

2.18  设有一个信源,它产生0、1序列的消息。它在任意时间而且不论以前发生过什么符号,均按p(0)=0.4,p(1)=0.6的概率发出符号。

(1) 试问这个信源是否是平稳的?

(2) 试计算,及。

(3) 试计算,并写出信源中所有可能有的符号。

解:

这个信源是平稳的。因为平稳信源的概率分布与时间起点无关,而该信源在任意时间而且不论以前发生过什么符号,概率分布均相同。

由于信源X={0,1}是无记忆的,则每个Xi 是的,所以有:

     

信源只产生0、1序列,所以所有组合如下:

2.19  有一个二元无记忆信源,其发0的概率为p,而,所以在发了二元序列中经常出现的是那些一串为0的序列(称高概率序列)。对于这样的信源我们可以用另一新信源来代替,新信源中只包含这些高概率序列。这时新信源,共有n+1个符号,它与高概率的二元序列的对应关系如下:

二元序列:  1,  01,001,0001,…,

新信源符号:,, , …,    ,  。

(1) 求。

(2) 当n →时,求信源的熵。

解:

由题,,则新信源概率分布:

(1) 求。

    

  当n →时,求信源的熵

2.20  黑白气象传真图的消息只有黑色和白色两种,即信源X=[黑,白],设黑色出现的概率为p(黑)=0.3,白色出现的概率p(白)=0.7。

(1) 假设图上黑白消息出现前后没有关联,求熵H(X)。

(2) 假设消息前后有关联,其依赖关系为p(白|白)=0.9,p(黑|白)=0.1,p(白|黑)=0.2,p(黑|黑)=0.8,求此一阶马尔科夫信源的熵H2(X)。

(3) 分别求上述两种信源的冗余度,并比较H(X)和的大小,并说明其物理意义。

解:

(1) H(X)=-0.3log0.3-0.7log0.7≈0.88(bit/符号)

(2) 状态转移概率矩阵为,设各状态的稳态分布概率为W1 = p’(白)和W2 = p’(黑)

则满足:W1=0.9 W1+0.2W2, W2=0.1 W1+0.8 W2,且W1+ W2=1

求得:W1 =,W2 =

信源X的最大熵为当p(黑)= p(白)=0.5时,H0(X)=1(bit/符号),则信源的冗余度为:

H(X)> H2(X),物理意义是:无记忆信源的不确定度大于有记忆信源的不确定度。下载本文

显示全文
专题