引擎排序算法中的内容相似性计算部分,通过故意加大目标词词频,
引|入与网页内容无关的单词来影响搜索结果排名。
81.1常见内容作弊手段
比较常见的内容
作弊方式包括如下几种。
1.关键词重复
对于作弊者关心的目标关键词,大量重复设置在页面内容中。因为词频是搜索引擎相似度计算中必然会考虑的因子,关键词重复本质上是通过提高目标关键词的词频来影响搜索引擎内容相似性排名的。
2.无关 查询词作弊
为了能够尽可能多地吸引搜索流量,作弊者在页面内容中增加很多和页面主题无关的关键词,这本质上也是种词频作弊, 即将原为0的单词词频增加到非 0词频, 以此吸引更多搜索引擎流量。
比如有的作弊者在网页的末端以不可见的方式加入堆单词词表,也有作弊者在正文内容插入某些热门查询词,甚有些页面内容是靠机器完全随机生成或者利用其他网页的页面内容片段随机拼凑而成的。
3.图片alt 标签文本作弊
alt标签原本是作为图片描述信息来使用的,般不会在HTML页面显示,除非用户将鼠标放在图片上,但是搜索引擎会利用这个信息,所以有些作弊者将alt标签的内容以作弊.
4.网页标题作弊
网页标题作弊 "”空图内容以作弊空图内容以作弊 网页标题作为描述网页内容的综述性信息,对于判断个网
网页标题作为描述网页内容的综述性信息,对于判断个网 页所讲述的主题是非常重
页所讲述的主题是非常重 美的自发因素,所以理索引在计欢相似性得分时,住往合地加市通边的有期股本公业
美的自发因素,所以理索引在计欢相似性得分时,住往合地加市通边的有期股本公业 者利用这点, 将与网页主题无关的目标词重复放置在标题位置来我有的分权重
者利用这点,将与网页主题无关的目标词重复放置在标题位置来我有的分权重 5.
5. 网页重要标签作弊
网页重要标签作弊 网页不像普通格式的文本,是带有HTML标签的,而有些HIML标签代表了强调内
网页不像普通格式的文本,是带有标签的,而有些标签的,而有些标签代表了强调内 容重要性的含义,比如加粗标记、, 段落标题、 , 字体大小标记等。搜索
容重要性的含义,比如加粗标记、,段落标题、 ,字体大小标记等。搜索 引擎般会利用这些信息进行排序,因为这些标记因素能够更好地体现网页的内容所表现引擎般会利用这些信息进行排序,因为这些标记因素能够更好地体现网页的内容所表现为作弊,