狂风中文网

第11讲 掌握多条信息时的推理② 以垃圾邮件过滤器为例(第2页)

天才一秒记住【狂风中文网】地址:https://www.kfzw.net

实际上,大多垃圾邮件的目的确实是引诱读者访问其他网址,因而附带有URL的链接。

因此,如果符合以下稳固关系,即:

垃圾邮件→URL上有链接

正常邮件→URL上无链接

那么就可以排除掉所有的垃圾邮件。

当然,按照5-3推论中的解说,也可以通过逆向思维做出如下判断:

URL上有链接→垃圾邮件

URL上无链接→正常邮件

然而遗憾的是,多多少少会有那么几封垃圾邮件中并没有其他链接,而来自朋友和公司的邮件中却附带链接,这就难办了。

在这种情况下,就必须使用5-3中提到的概率推论相关的“可能性”

判断方法,即:

URL上有链接→可能是垃圾邮件

URL上无链接→可能是正常邮件

对于这种“可能性”

进行数值评价,需要运用到贝叶斯推理。

因此,就很有必要设定:垃圾邮件中附带URL的比例,以及正常邮件中附带URL的比例各占多少。

为了方便计算,以下采用虚构的数据来进行简单运算,如图表11-2、11-3所示。

图表11-2附带链接的条件概率

图表11-34种互不相同的可能性

虽然之前已经进行过说明,但为了保险起见,下面,再一次对图表11-3进行讲解。

现在,过滤器要对刚刚收到的一封邮件进行检查。

此时的过滤器将会面临四种情况。

首先,把收到邮件的可能性分为垃圾邮件和正常邮件两类。

然后,根据有无链接,再各自分为两类。

所以,一共存在四种可能性。

接下来,再进一步判定究竟哪一种可能性是符合实际的。

11-4根据扫描结果,计算垃圾邮件的贝叶斯逆概率

过滤器扫描完邮件后得到的结论是“附带链接”

此时,就不必再考虑“无链接”

的两种可能性,只需要考虑剩余的两种可能性,如图表11-4所示。

图表11-4可能性被限定为两种

恢复标准化条件(相加之和为1)之后,通过这张图可以计算出后验概率为:

在有链接的情况下,

本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!

如遇章节错误,请点击报错(无需登陆)

新书推荐

沧元图当我绑定三次元论坛后八零团宠:玄学小福包有空间沈影帝的小甜妻被帝国背叛后,我决定辅佐魔王穿成反派的病弱同桌做好事就变强诸天将至:还好我有人生模拟器生崽热搜后,帝国总裁夜夜来哄娃世子很凶傻了吧,爷有星兽沙雕攻在虐文世界搞钱为夫体弱多病无限版帝国时代俗世妖人农家小福女:大佬她被迫算命营业废柴从今天开始反攻诸世大罗穿书后我靠学习当团宠从契约精灵开始争霸文里的娇软美人大唐之我太上皇绝不摊牌我要名垂千古总裁大人超给力交锋