请选择 进入手机版 | 继续访问电脑版

TB外链干货论坛

 找回密码
立即注册
查看: 78|回复: 0

360搜索推出ICO算法:专门处理低质量和重复的内容

[复制链接]

15万

主题

15万

帖子

58万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
589155
发表于 2021-6-4 13:20:30 | 显示全部楼层 |阅读模式


品牌博客一般在工作日发表博文



360搜索部门的工作人员告诉我360已经推出了ICO算法了,ICO 全称:Index clear optimize,简单来说就是处理重复内容的算法。这也意味着,这是继Google、百度之后,又一家敢公布算法的搜索引擎,也是自信的一种表现。

360也聪明了,为了避免之前百度犯过的错(每次更新不明不白,导致怨声载道),所以在360搜索逐渐强大的时候公布每一次算法的改动。

ICO算法是对已经入索引库的低质量URL和无效URL数据进行清理的算法,在不同的阶段会对不同类型的无效数据进行清理,该算法是一个长期执行的算法。

一次清理超过10亿页面的算法360搜索都将提前公布告知站长,并告知算法优化处理的主要方向。


ICO算法:

处理量级:10亿以上

处理网页特点:

该算法主要是针对重复内容进行清理,对用户没有价值的内容页面,内容时效性强且过期的页面,采集站类,URL地址含有无效参数的页面等。

例如:招聘类网站不同子站中内容相同的页面,小说采集站尤其处理对用户无价值的页面,旧新闻页且内容重复的页面也会处理一部分,以及其他的部分无效页面。


营销价值最高的渠道排行榜

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|TB外链干货论坛 ( 浙ICP备2021013751号-2 )|网站地图

GMT, 2021-10-17 04:09 , Processed in 0.108356 second(s), 19 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表