151-3895-5886

分类信息网站应怎样防范垃圾信息

2019年09月24日 维尼网络
  办法一通过提取信息里的联系方式,建立联系方式黑名单

垃圾信息制造者不管IP怎么变、内容怎么变,但是联系方式是不变的。我们可以根据这一点来建立联系方式黑名单数据库。目前中国用户用的最多的联系方式有:电话号码、QQ号、URL、Email地址等。这些联系方式都有一定的特征,很容易通过正则表达式提取出来。那么具体怎么建立黑名单呢?列表网的做法是:如果一条信息被用户恶评五次,那么该信息自动标记为恶评状态并隐藏。经确认的被用户投诉的信息也被置于恶评状态。当一条信息被置于恶评的时候,该恶评信息里的所有联系方式均被存入黑名单数据库中,并且出现频率字段加1。这样我们就有了联系方式黑名单数据库了,该数据库有联系方式的出现频率及最新出现时间等信息。所有这些操作除了用户投诉需要人工辨别外,其他的都是机器自动完成的。

办法二鉴别并删除异地商家信息

分类信息网站的特点之一就是本地性,本地用户到分类信息网站上来看的就是本地的租房、交友、服务等信息。因此如果信息里面出现异地的电话号码的话则需要作为垃圾信息处理。这个可以通过手机属地数据库及电话区号数据库来判断。并不是所有的类目都适用这条办法的,像交友、寻人类目就不需要采用这种办法。但是像二手车类目、服务类目则完全可以采用这种办法过滤掉异地信息。

办法三限制某些类目同一天内一个用户只能发布一条信息

重复的信息太多了,对用户的体验也不好。在这里重复信息的定义是:同一个用户或商家(包括商家聘请的信息发布者)发布的内容相同或相似的信息。这些类目包括:生活服务、商务服务、培训、交友、车辆等。那么怎么避免重复信息的发布呢?列表网的做法是:在这些类目中用户一天内发布的所有信息中只保留最近发布的信息,其他信息则删除。

办法四关键词过滤

最后不要忘了关键词过滤。一些有害的、敏感的关键词是肯定需要过滤的。

以上是分类信息网站可以采纳的反垃圾信息的简单的行之有效的几种方式。如果能配合贝叶斯算法过滤垃圾信息那就更完美了。

阅读更多内容
上一篇行业网站搜索优化与做网站的四个特殊点
下一篇公司做网站过程中七个常见问题

声明:本页内容由郑州维尼网络收集编辑所得,所有资料仅供用户参考,转载请保留此链接http://www.zzwn.cn/website/4489.html

本文标签:

 

相关资讯 Related Info
相关分类 News Classification
解决方案 Solutions
相关热点 Hot spot
新建网站怎么让网站原创内容来源 新建网站怎么让网站原创内容来源
  1. 我们的承诺
  2. 我们的实力
  3. 我们的未来
郑州做网站咨询电话 建站咨询

151-3895-5886

网站备案安全放心网站

地址:郑州市上街区和昌都汇广场 / 电话:151-3895-5886
客服QQ: 7758021 / 邮箱:admin@zzwn.cn
Copyright © 2010-2019 郑州融科网络 版权所有