浏览器-假如由您来设计一个网络广告过滤算法

浏览器-假如由您来设计一个网络广告过滤算法

浮生未歇 发布于 2017-07-06 字数 2100 浏览 1052 回复 5

时下各种垃圾广告满天飞,数不清的知名或不知名网站坑爹的页面设计让你误点广告
个人认为,不良广告到处得瑟就是病毒!
对广告投放平台而言
分析访问者身份而针性对投放广告的方法不论定义准确率,一切强加给浏览者的广告都是绑架别人眼球耳朵的行为
付费用户去广告是歧视免费用户的行为,看个短视频也先送一分钟广告……
本人想法是,给用户自由选择权,将要投放的广告分门别类,用户可以选接受的类别,但这仅限于自有网站或软件,广告主认不认同也是问题
现在一些浏览器也有这方面的功能,但做得不够好吧,其拥有者还要靠广告混饭。一些知名下载平台,一不小心就点错下载了个xx浏览器……

假如由您来设计一个网络广告过滤程序,会从哪些方面入手?
最好是用户可自定义接收自己感兴趣的广告类别,而不受其它广告骚扰

非常期望有志于改善网络环境的朋友们特别是有这方面经验和能力的个人或组织来群策群力,开发出个功能过硬的相关免费软件,那将会是广大网友的福音。先行谢过各位参与讨论,以我个人的能力目前还不足以开发此类软件,仅在此抛砖引玉

个人想法:对垃圾广告,可以类似杀毒平台的病毒库一样,建立个云端信息库,以便于对比处理。信息库向全网民公开,由网友用所设计的软件负责捉取和上传,只要少数人做了,其它人更新信息库即可受益。
1、弹窗类:精准屏弊,不能全部屏蔽,否则会让各种合理的应用躺着中枪,这样设计的软件也注定失败。只能借助于对比信息库来分类处理。像QQ中奖等诈骗类,可在软件使用说明里做个防骗指南。
2、网页内置垃圾广告:用同样大小的内容块“替换”。能直接删除而不影响页面整体排版的垃圾广告或内容只是少数。个人认为内容替换应该是最可行的办法。这就需要软件设计个内容池,所有内容必须是网民认可的。内容池可分为本地的和平台共享的,优先级和种类应该都是可以由使用者自定义,支持用自己电脑里的图片等资料。平台共享的内容池可由像信息库一样对网民开放,让大家上传分享东东。当然,开发者或许可以利用内容池合理的赚点钱钱,这也许是最重要的一点。(为赚钱替换了人家的广告可能违规或违法,可偌大的天朝是谁不作为而弄得这么乱的?)
以上两点都不是基于纯文字类的,对于纯文字类,从链接入手,设立链接黑名单。无链接的就不管

关于内容替换是我今天才想到的,真想自已先做个小软件验证下,无奈眼高手低……
PS:我刚转行搞网络编程,还望各同行指点

如果你对这篇文章有疑问,欢迎到本站 社区 发帖提问或使用手Q扫描下方二维码加群参与讨论,获取更多帮助。

扫码加入群聊

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(5

晚风撩人 2017-10-14 5 楼

可以让用户选择页面那个是广告,哪个不是,然后获取广告的代码,保存以后就禁止这段代码加载 然后可以把数据发送到服务器 其他人浏览这个网页的时候自动禁用这段代码

归属感 2017-09-27 4 楼

Firefox的插件AdBlock Plus已经做得非常好了。用户自己选择是广告的部分屏蔽然后提交到服务器,有多个用户提交了就自动放进全局阻止名单里面,以后别的用户访问时就自动屏蔽掉了。这叫做让垃圾广告陷入人民战争的海洋。

而且AdBlock Plus可以按照来源或者链接来屏蔽。像国内可能20%(假设)的网站广告都是百度提供的,因为百度广告那个域名根被屏蔽了,这些链接包括呈现链接的图片全都自动被屏蔽了。这也是相当要命的一点,网站主再把广告做的花哨、做的像正常链接,不链到那个能给他付钱的地址就没有意义了;所以链接的目标地址伪造不了。

偏爱自由 2017-08-29 3 楼

楼主的第一条。弹窗类。这个确实可以搞个云数据库,可问题在于数据库这雪球越来越大,到时这个雪球可能比网页本身都要大。。。。
第二条。替换之法。本身就是一个违法的行为。你可替换它。它也可替换你的内容。。。。。

可否限制连接层数、连接域。比如:打开www.123.com/a.asp页面中加载的内容,只允许www.123.com这个域中的内容,而外域加载的内容就是云数据库中允许的域。必竟安全的域又有知名度的门户网站数量是有限的,增长率也只有一天几个而以。

夜无邪 2017-08-01 2 楼

不知道大家有没有发现,好多网站的广告都是和我们自身相关的。也就是你最近在百度搜索过什么关键词,一般就会出现什么广告,这说明百度在过滤广告,当然还远远不够。没有达到过滤垃圾、诈骗广告了。那如果我们也可以记录搜索的这些关键词,对于不包含这些关键词的漂浮广告优先过滤,那世界清静多了。当然如果能让广告源过滤垃圾广告就更好了。

灵芸 2017-07-07 1 楼

我有以下几个想法,都是临时想到的,给 网友仅做参考。

首先我们要确定我们要过滤的是什么东西,广告。广告有很多种形式,文字广告,图片广告,FLASH广告,或者还有其他形式的,但目前我还没有想到。对于这三种形式的广告,前两种形式是比较容易解决的,文字广告我们可以分析其内容与主题的关联度(这里应该要涉及到神经网络之类的智能算法),图片广告我们也可以通过计算机读出其中文字信息进行分析,关于flash能否取出其内文字信息,因为我对flash没有太多了解,所以我也不敢确定,但我想应该是可以的。

然后我们还要确定我们的主题是什么,主题的确定我们可以借鉴搜索引擎的方法,读取网页的title以及网页中的标签和无障碍网页内容来确定网页的几个主要主题。

再者,我们要如何确定过滤信息的准确性,这点非常重要,是该软件是否实用的关键。通过对垃圾广告进行收集入库是个好办法,但可能仍无法满足用户的要求。这里我觉得还是要应用人工智能技术来不断让软件进行学习,进行自我改进,提高准确度。

以上都是本人拙见, 网友不要见笑。