本报讯 随着Web 2.0的火爆,全球博客数量与日俱增。
但其中,至少有数百万计的垃圾博客,他们的存在仅仅是为了骗取访问量。对此,博客搜索引擎毫不否认,但同时表示,他们能做的只是在一定程度上将垃圾博客“拒之门外”。
但问题是,如果这些垃圾博客继续骚扰搜索引擎,那么用户必将对搜索引擎产生反感,并最终放弃。而广告商同样会质疑搜索引擎广告的价值。对此,研究人员和搜索引擎服务商也心知肚明。
搜索质量被降低
据最新统计数据显示,当前,在博客搜索引擎的搜索结果中,至少有1/5的内容是垃圾博客。博客搜索引擎Technorati工程副总裁Adam Hertz称:“由于垃圾博客日益增多,我们的整体搜索质量正在下滑。”
Hertz还称,为了对垃圾博客进行过滤,Technorati不得不投入额外的资金来解决这一难题。正是基于对服务质量的考虑,Technorati还组织了一次业内峰会,邀请Google、雅虎、微软和AOL等搜索巨头共商大计。
对于普通网民而言,Hertz认为,用户并不会因为看见垃圾博客而放弃使用博客搜索引擎。Hertz说:“与垃圾邮件一样,用户最终会对垃圾博客习以为常。没有人会因为看见垃圾邮件而放弃使用Google,但人们应该学会精确搜索,尽量避免垃圾内容的出现。”
5篇新博客一篇是垃圾
当前,尽管一些博客搜索引擎已经为用户提供了所拦截的垃圾博客数量。但事实上,究竟有多少垃圾博客逃过拦截还不得而知。据美国马里兰大学的统计数据显示,在Technorati的索引中,每5篇新博客中就有1篇是垃圾博客。何况,Technorati索引还被视为业内质量最好的。
该比例与博客监控公司Umbria的数据基本一致:Umbria去年的一项调查结果显示,在所有博客中,有10~20%的为垃圾博客。Umbria对BlogPulse、IceRocket和Technorati三大博客搜索引擎进行了调查,结果发现,在搜索结果的前100篇博客中,平均有44篇为垃圾博客。
破坏在线广告模式
业内专家认为,垃圾博客不仅影响了搜索引擎公司的服务质量,更重要的是它将潜在地破坏当前的在线广告模式——广告商是以广告的点击次数付费的。
业内资深人士Pranam Kolari表示:“如果广告商发现许多点击都是毫无价值的,点击者并不是他们所预期的对象,那么他们就会对这种广告形式失去信心。”
这其中,Google可能成为潜在的受害者。因为Google的AdSense广告模式正是基于这种赢利模式。对此,Google发言人称:“我们的广告模式是建立在广告商、用户和发行商的利益和需求平衡基础之上。对于这种垃圾内容,我们将采取适当的对策,如查封账户等。”
对于搜索引擎服务商而言,检测垃圾博客是一项比较复杂的工作。因为搜索引擎要迅速给出查询结果,而且该结果是根据博客发布时间来排序的。Kolari说:“当一篇新博客进入时,搜索服务商必须在短期内判断出是否为垃圾博客,”
那么,其结果就是,搜索引擎最初会对垃圾博客放行。然后,经过一周甚至更长的时间后,才发现是垃圾博客。Kolari最后称:“这就是问题所在,两者之间有一定的差距。”