6 不确定性推理
6.1 不确定性知识的表示及推理
不确定性信息:不能确定真实性的信息
- 不确定性&不确切性:前者是指不能确定真伪的信息,后者是指对事物描述的不够具体、不够精确的信息
可信度:一种量化不确定性知识的不确定性的方式,用\(c(S)\)表示命题\(S\)的可信度
- 二元组\((S,c(S))\)可作为不确定性命题的一种表示形式
- 不确定性产生式规则\(A\rightarrow B\)可表示为\((A\rightarrow B, c(A\rightarrow B))\)或\(A\rightarrow (B,c(B|A))\)
不确定性推理:符号推演+可信度计算
- 涉及可信度、阈值及可信度计算和传播方法的定义和选取
- 经典模型:概率推理、确定性理论、主观贝叶斯方法、证据理论、贝叶斯网络等
6.2 确定性理论/可信度方法
信任增长度MB:
\[ MB(H,E)= \begin{cases} 1&,P(H)=1\\ \frac{\max\{P(H|E),P(H)\}-P(H)}{1-P(H)}&,otherwise \end{cases} \]
不信任增长度MD:
\[ MD(H,E)= \begin{cases} 1&,P(H)=0\\ \frac{\min\{P(H|E),P(H)\}-P(H)}{-P(H)}&,otherwise \end{cases} \]
可信度CF:给定规则的前提\(E\)、规则的结论\(H\),那么可以使用可信度CF作为不确定性的度量:
\[ CF(H,E)= \begin{cases} \frac{P(H|E)-P(H)}{1-P(H)}&,P(H|E)>P(H)\\ 0&,P(H|E)=P(H)\\ \frac{P(H|E)-P(H)}{P(H)}&,P(H|E)<P(H) \end{cases} \]
- \(CF(H,E)\in [-1,1]\)
- \(CF(H,E)=1\),则\(H\)肯定真
- \(CF(H,E)=-1\),则\(H\)肯定假
- \(CF(H,E)=1\),则\(H\)与\(E\)无关
- \(CF(H,E)=MB(H,E)-MD(H,E)\)
- 证据的不确定性表示:\(CF(E)\in [-1,1]\)
- \(CF(E)=1\),则\(E\)肯定真
- \(CF(E)=-1\),则\(E\)肯定假
- \(CF(E)=1\),则对\(E\)一无所知
- 对同一前提\(E\),若支持若干个不同的结论\(H_1\cdots H_n\),则\(\sum_{i=1}^{n}{CF(H_i,E)}\leq 1\)
- 可信度方法的宗旨不是理论上的严密性,二十处理实际问题的可用性
前提证据事实总可信度计算:
- \(CF(E_1\wedge E_2\wedge \cdots \wedge E_n)=\min\{CF(E_1),CF(E_2),\cdots,CF(E_n)\}\)
- \(CF(E_1\vee E_2\vee \cdots \vee E_n)=\max\{CF(E_1),CF(E_2),\cdots,CF(E_n)\}\)
推理结论可信度计算:\(CF(H)=CF(H,E)\cdot \max\{0,CF(E)\}\)
不确定性的合成:若同一结论\(H\)分别被不同的两条规则推出,得到可信度\(CF_1(H)\)和\(CF_2(H)\),则\(CF\)为:
\[ CF= \begin{cases} CF_1+CF_2-CF_1*CF_2&,CF_1\geq 0,CF_2\geq 0\\ CF_1+CF_2+CF_1*CF_2&,CF_1< 0,CF_2< 0\\ \frac{CF_1+CF_2}{1-\min\{|CF_1|,|CF_2|\}}&,CF_1与CF_2异号 \end{cases} \]
带阈值限度的可信度推理:
- 不确定性表示为\(if\ E\ then\ H\ (CF(H,E),\lambda)\)
- 不确定性的合成:极大值法、加权求和法、有限和法
- 不确定性的更新:当\(CF(E)>\lambda\)时,\(CF(H)=CF(H,E)*CF(E)\)
带加权因子的可信度推理:
- 不确定性表示为\(if\ E_1(w_1)\ and\ E_2(w_2)\ and\ \cdots \ E_n(w_n)\ then\ H\ CF(H,E)\)
- 不确定性的合成:\(CF(E)=\sum_{i=1}^{n}CF(E_i)*w_i\)
- 不确定性的更新:\(CF(H)=CF(H,E)*CF(E)\)
6.3 证据理论(D-S理论)
识别框架:所考察判断的事物或对象的集合,记为\(\Omega\)
- \(2^{\Omega}\)表示幂集
概率分配函数:给定识别框架\(\Omega\),\(A\in 2^{\Omega}\),称\(m(A):2^{\Omega}\rightarrow [0,1]\)是\(2^{\Omega}\)上的一个概率分配函数,若它满足:(1)\(m(\emptyset)=0\);(2)\(\sum_{A\subseteq \Omega} m(A)=1\)
信任函数:给定识别框架\(\Omega\),\(\forall A\in 2^{\Omega}\),\(Bel(A)=\sum_{B\subseteq A}m(B)\)称为\(2^{\Omega}\)上的信任函数
- 信任函数表示对A为真的信任程度,
- 信任函数也称为下限函数
- 性质:
- \(Bel(\emptyset)=0\),\(Bel(\Omega)=1\),\(Bel(A)\in [0,1]\)
- 信任函数为递增函数,若\(A_1\subseteq A_2\subseteq \Omega\),则\(Bel(A_1)\leq Bel(A_2)\)
- \(Bel(A)+Bel(A')\leq 1\),其中\(A'\)是\(A\)的补集
似然函数:\(Pl(A)=1-Bel(A')\),其中\(A\in 2^{\Omega}\),\(A'\)为\(A\)的补集,则\(Pl(A)\)称为\(A\)的似然函数,函数值称为似然度
- 似然函数表示对A非假的信任程度
- 似然函数也称为上限函数
- 性质:
- \(Pl(A)+Pl(A')\geq 1\)
- \(Pl(A)\geq Bel(A)\)
- \(Pl(A)=\sum_{A\cap B \neq \emptyset}m(B)\)
- 似然函数与信任函数:\(0\leq Bel(A)\leq Pl(A)\leq 1\)
信任区间:\([Bel(A),Pl(A)]\),刻画了对\(A\)所持信任程度的上下限
Dempster组合规则(概率分配函数的正交和):设\(m_1(A)\)和\(m_2(A)\)是识别框架基于不同证据的两个概率分配函数,则可进行规则合并:
\[ m(A)= \begin{cases} 0&,A=\emptyset\\ K\cdot \sum_{B\cap C=A}m_1(B)m_2(C)&,A\neq \emptyset\\ \end{cases} \]
其中\(K=(1-\sum_{B\cap C=\emptyset}m_1(B)m_2(C))^{-1}\),称为规范数。该表达式称为\(m_1\)与\(m_2\)的正交和,记为\(m=m_1\oplus m_2\)
- 规范数的引入实际是把空集所丢弃的正交和按比例地补到非空集上
- \(\sum_{A\subseteq \Omega}m(A)=1\)
证据理论的推理模型:
- 建立问题的识别框架\(\Omega\)
- 给幂集\(2^{\Omega}\)定义概率分配函数
- 概率分配函数可由经验给出,或由随机性规则和事实的可信度度量计算求得
- 计算所关心的子集\(A\in 2^{\Omega}\)的信任函数值\(Bel(A)\)和似然函数值\(Pl(A)\)
- 由\(Bel(A)\)和\(Pl(A)\)得出结论
6.4 基于贝叶斯网络的概率推理
贝叶斯网络:一种以随机变量为节点,以条件概率为节点间关系强度的有向无环图
- 又称因果网络、信念网络、概率网络、知识图等
- 节点一般代表事件、对象、属性或状态;有向边一般表示节点间的因果关系
- 每个节点附一个条件概率表CPT
- 设贝叶斯网络中全体变量为\(X=\{x_1,x_2,\cdots, x_n\}\),则联合概率为\(P(x_1,x_2,\cdots,x_n)=\prod_{i=1}^{n}P(x_i|x_1x_2\cdots x_{i-1})\)
- 应用:因果推理(预测)、诊断推理(诊断)、混合推理等
因果推理(预测):由原因到结果,即已知网络中的祖先节点,计算后代节点的条件概率
- 对于所求的询问节点的条件概率,用所给证据节点和询问节点的所有因节点的联合概率进行重新表达
- 对所得表达式进行适当变形,直到其中的所有概率值都可以从问题贝叶斯网络的CPT中得到
- 将相关概率值带入概率表达式进行计算即得所求询问节点的条件概率
诊断推理(诊断):由结果到原因,即已知网络中的后代节点,计算祖先节点的条件概率
- 利用贝叶斯公式将诊断推理问题转化为因果推理问题
- 用因果推理的结果导出诊断推理的结果