google三大算法解析回顾

Posted by admin on 2010-02-02 in 谷歌搜索引擎营销研究 | Subscribe

SEO排名之LSI

搜索引擎通过潜在语义索引 (Latent Semantic Indexing,LSI)算法来发现这些作弊页面,LSI算法也是信息检索领域一种古老的算法,1988年由S.T. Dumais等 人提出,主要用于自然语言理解,通过统计的方法对文档的进行语义分析,发掘同义词,相关词组等等。
LSI算法提醒我们在搜索引擎优化的时候要注意页面的关键词密度,以及相关词组的使用,尽量使用比较自然的语言方式来提高页面的相关性。

seo排名之TSPR
TSPR借鉴了早期开发目录 (ODP,如Yahoo,Dmoz等)的思想并结合PageRank算法:针对一个查询来确定一个URL对该查询的主题敏感性得分,作为排名的一个重要依据,大大提高了返回结果的主题相关性。

总结:换不同的主题提交开放目录,让重要页面提高主题敏感度而得分。

SEO排名之HILLTOP
HillTop是一种查询相关性链接分析算法,克服了的PageRank的查询无关性的缺点。简单的说HillTop算法是针对热门

查询关键词来对搜索结果重新排序的一种算法。之所以针对热门关键词,这是因为HillTop算法运行效率较低的原因。

算法主要分为两个过程:

<!–[if !supportLists]–>一、              <!–[endif]–>专家页面的寻找和评分;搜索引擎根据用户查询日志

发现热门关键词后,开始针对这些热门关键词寻找专家页面,成为专家页的2个必要因素,1)必须拥有足够多而且不

存在隶属关系的出链,2)至少存在一个短语包含该热门关键词的所有术语。确定专家页以后,在该页面上找出所有全

部包含热门关键词中术语、或者差1到2两个术语的短语,将这些短语分为三个等级,分别为全部包含,差1个和差2个

术语,分别对这个三等级计算等级分,等级是分对各个等级中所有短语得分的和,而短语得分取决于这个短语在页面

中位置,分数从高到低依次标题、头部和锚文本等等,然后的综合计算这个三个等级得分就得到专家分。以下举个简

单的以“计算机技术”这个热门关键词为例,“计算机技术”的首页和友情链接页就是这个关键词的专家页面,因为

他具有足够多而且不隶属seo-ly.cn主机域名和同C类ip的出链,同时标题中的“计算机技术”也包含“计算机”和“

技术”这两个术语。接下来评分,先算第一等级(包含所有术语的短语)的得分,短语“中国汽车消费网”在标题中得

到16分(假设),以及在锚文本中“计算机技术讲座”得了1分,那么第一等级得分为17分,再算第二等级(差一个术

语),第三等级(差两个术语)。这样再算三个等级得分的加权和,就是专家分,注意这三个等级权重相差非常大,

在原算法的等级1到等级3的权重分别是2^32,2^16和1,因为HillTop更喜欢完全匹配。

<!–[if !supportLists]–>二、              <!–[endif]–>对目标页评分;一个专家页对目标页的评分等于专家

本身分值×专家页可区分的短语数量。取前N个指向目标页的专家页,对于多个同一隶属的专家页指向该目标页,取分

值最高的专家页,然后这些专家页对目标网页的评分的和就得到,这个页面对应这个热门关键词的得分,有人称之为行

业得分。

我们可以看到HillTop算法通过不同等级的评分确保了评价结果对关键词的相关性,通过不同位置的评分确保了主题(

行业)的相关性,通过可区分短语数防止了关键词的堆砌。

相关文章

  • 没有相关文章

发表评论

XHTML: You can use these tags:' <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Copyright 豫ICP备11004983号-实战型网络营销博客--周宽网络营销顾问 QQ: 277947742| 网络营销| 企业网络营销|seo