Solidot 登录
[ 创建一个新帐号 ]
可笑的网页关键词过滤
上次提到的CHM电子书设置关键词过滤,实际上应该是在网页打包成CHM时,网站本身设定的关键词过滤脚本,因为CHM要调用到web engine。随着反低俗运动的进展,目前网站设置的过滤脚本也越来越复杂和夸张,如以起点中文网为例,打开网页的源代码,你会找到一段forbidKeywords脚本,后面的关键词之多令人胆寒(不是明文,是UTF8escape编码格式)。但这种简单的被禁词语替换方式,常常会对文字语境和理解造成不必要的困惑。一位读者在看小说《窃明》时候,体验到了这种可笑的关键词屏蔽,如:
1、贺宝刀小心地把熏好的刀(禁止)鞘中,又开始熏他的抢头
答案:这里的(禁止)是“插入”....
3、“他们要稍微蓄养一(禁止)力。”
答案:这里的(禁止)是“下体”...
4、陈继盛这话说得就如同一个乞丐,然后就眼巴巴地望着黄石,希望他松(被禁止)出些钱来。
答案:这里的(被禁止)实在是有点难猜,后来想明白应该是“口交”!
答案:这里的(禁止)是“插入”....
3、“他们要稍微蓄养一(禁止)力。”
答案:这里的(禁止)是“下体”...
4、陈继盛这话说得就如同一个乞丐,然后就眼巴巴地望着黄石,希望他松(被禁止)出些钱来。
答案:这里的(被禁止)实在是有点难猜,后来想明白应该是“口交”!
相关文章
连CHM电子书都设置关键词过滤 5 条评论
[+]
国内媒体的“自我审查”有时达到了令人难以想象、不可思议的程度,几乎所有的论坛、社区和新闻类网站都有关键词过滤。
est's blog在日志中提到现在连本地CHM电子书都设置关键词过滤:作者指出CHM电子书能ajax嵌入后门,所以当他发现电子书中的一些文字被以“**”替换掉后,第一步拔掉网线,在Sandboxie中打开,发现问题依旧;随后他用一行命令反编译chm电子书(hh.exe -decompile 142317 142317.chm),结果发现了几个可疑的js,打开一看赫然是关键词替换。
This discussion has been archived.
No new comments can be posted.
声明:
下面的评论属于其发表者所有,不代表本站的观点和立场,我们不负责他们说什么。









一切都从自我审查开始
(得分:1)能找出来真是个本事
(得分:2, 有趣)( 最新日志: 2009年7月25日 00时10分 星期六 )
让我想起了我的wow生涯
(得分:2, 有趣)再添几个
(得分:2, 有趣)所以我们提出了解决方案
(得分:2, 识见广博)( 最新日志: 2009年4月18日 12时03分 星期六 )
起点的关键字很黄很下流
(得分:3, 识见广博)地址栏输入
javascript:alert(unescape(__forbidKeywords));
然后回车就可以看到