【百度算法专利】百度的这两项算法专利你知道吗?
就现在来看百度搜索无论是在用户人数还是搜索引擎技术都比360和搜狗强大太多,做为seo优化人员了解百度的算法专利就很有必要了。百度有两项算法专利技术,一项是搜索引擎超链分析技术;另一项是搜索引擎投票算法。
那么我们就根据百度搜索引擎排名的核心专利技术进行分析吧!
超链分析(ESP)技术的本质是一种“投票”机制,一个链接可以看作一个网页对另一个网页的投票,票数决定排序。除了基本的投票机制,该技术还具有两方面特征:将链接文字作为重要信息加以利用,使搜索引擎更准确地理解目标网页的内容,从而有效地提高了搜索结果的相关性;根据投票者自身的权威性、推荐方式等属性调整投票权重,从而有效地提高了搜索结果的权威性。
襄阳seo下面对这两项百度算法专利做出更新详细的解释
一、搜索引擎超链分析算法
超链分析专利其实就是现实生活中类似于链接关系的应用。要判断哪个页面最具权威性,不能光看页面自己怎么说,还要看其他页面怎么评价。李彦宏1997年就提交了一份名为“超链文件检索系统和方法”的专利申请,这比GOOGLE创始人发明PR要早得多,不得不说这是非常具有前瞻性的研究工作。
在这份专利中,李彦宏提出了与传统信息检索系统不同的基于链接的排名方法。这个系统除了索引页面之外,还建立一个链接词库,记录链接锚文字的一些相关信息,如锚文字中包含哪些关键词,发出链接的页面索引,包含特定锚文字的链接总数,包含特定关键词的链接都指向哪些页面。词库不仅包含关键词原型,也包含同一个词干的其他衍生关键词。
根据这些链接数据,尤其是锚文字,计算出基于链接的文件相关性。在用户搜索时,将得到的基于链接的相关性与基于关键词匹配的传统相关性综合使用,得到更准确的排名。
在今天看来,这种基于链接的相关性计算是搜索引擎的常态,每个SEO人员都知道。但是在十三四年前,这无疑是非常创新的概念。当然现在的搜索引擎算法对链接的考虑,已经不仅仅是锚文字,实际上要复杂的多。一个与根据超链指向的查询索引文档相关,用于检索文档的搜索引擎。它的索引器遍历超文本数据库并寻找包括超链指向的文档地址与每个超链的锚文本在内的超文本信息。
超文本信息是贮存在一个倒排索引文件里,这个倒排索引文件亦可用于计算对于各超链指向的特定文档链接向量。输入查询时候,搜索引擎找到锚文本里含有查询词的全部文档的向量。此外计算了查询向量,然后算出查询向量跟每个文档链接向量的点积。特定文档相关点积的加总确定每一个文档的相关性排名这份专利所有人是李彦宏当时所在的公司,发明人是李彦宏本人。这项百度算法专利可以说是搜索引擎工作的基础了。
二、搜索引擎投票排名算法:
这个算法是在超链分析技术之后延伸的一个投票记录算法 (搜索引擎排名规则)
搜索引擎排序规则需要在搜索展现与访问之间做出有效分析、对比并记录的.无论是百度排名还是google等搜索引擎结果展示并不是很容易判断关键词与快照的权威性,如何判断关键词与实际快照的权威性呢?搜索引擎自然排名
一定是从用户出发,根据有效搜索做出判断,人自然检索一个关键词并访问结果时,用户经常会找不到自己想要的结果,所以当人自然检索后虽然访问到了您的网站,但不一定是有效搜索,因为最后搜索不一定会停留到您的网站上。
假如:您搜索一个词,打开第一位结果,发现不是你想要的,您肯定会继续访问下面的结果,直到找到你需要的结果后才停止访问剩余结果(也有可能您根本找不到自己想要的结果)当您找到需要的结果后自然不会继续访问剩余的结果,最后停留的目标页面被称之为有效搜索;虽然这个思路和算法还存在很多缺陷,但是大部分搜索引擎还是以这个算法为最佳算法,因为搜索引擎无法判断出来关键词与快照的权威性。
李彦宏的这两项百度算法专利为现代搜索引擎发展指明了趋势和方向,标志着互联网搜索引擎进入了快速发展时代。而李彦宏相关超链分析的论文也被各种研究大篇幅引用,至今超链分析已被211件国际专利引用,并被世界各大搜索引擎普遍采纳。打个比方就是,超链分析搭起搜索新平台,其他人借助这个新平台衍生个性化的发展。
版权保护: 本文由向日葵seo原创,转载必须保留链接:http://www.1hseo.com/seozyfx/366.html
90%的人会对以下内容感兴趣:
....................... .......................