链接算法-pagerank算法解析

 2023-12-25  阅读 2  评论 0

摘要:虚拟服务器为什么仍然存在?其主要用途介绍 虚拟服务器已经被使用了很多年,其是区别于物理服务器配置的方式,可以用来托管网站。在网站服务器的选择中,虚拟服务器以低成本而备受用户喜爱与选择。 谈到网站推广,这里就不得SEO与SEM。 SEM不过是SEO推广的分支,这里暂且不谈

链接算法-pagerank算法解析

虚拟服务器为什么仍然存在?其主要用途介绍

虚拟服务器已经被使用了很多年,其是区别于物理服务器配置的方式,可以用来托管网站。在网站服务器的选择中,虚拟服务器以低成本而备受用户喜爱与选择。

谈到网站推广,这里就不得SEO与SEM。

SEM不过是SEO推广的分支,这里暂且不谈。主要这是花钱既有展现,推广一旦停止既没有流量。

SEO涉及的算法就比较多了,其有一句为:“内容为王,外链为皇”。虽然外链的作用不断降低,不过目前在搜索中依旧占据举足轻重的地位。

本次我们谈一下链接算法始祖——PageRank算法

一、PageRank算法简述

1.PageRank算法

PageRank是网站投票的一个机制,比如A页面有B页面的链接,这就算是A给B的一个投票。这个投票中传递一个参数叫做“权值”。

当一个页面拥有很多网站的投票,则这个页面就越重要,接收到的权值多,也越容易受到搜索引擎的“青睐”。

2.PageRank算法中的链接陷阱

我们可以想象如果互联网不存在检索词,只有PageRank算法决定排名,则接收到权值最多的网站则排名越好。

所以也就出现了链接陷阱,比如D页面指向A,而这个A页面的关系却如下:

A→B→C→A

可以看到这就是一个链接陷阱,A、B、C绕了一圈就回去了,获取的权值会越来越多,却不会往外输出权值。其积累的权重会越来越多……

3.远程跳转

为了避免出现先前的链接陷阱,后续谷歌在算法中加入了链接远程跳转。

A→B→C→?

当一些页面互联一圈后,蜘蛛会在库中随机挑选URL跳出,把权值带走。

?中的页面是随机的跳转的,因此也叫远程跳转。

二、PageRank传值算法

假设一个由4个网页组成的群体:A,B,C和D。如果所有页面都只链接至A,那么A的PR(PageRank)值将是B,C及D的Pagerank总和。

 

重新假设B链接到A和C,C只链接到A,并且D链接到全部其他的3个页面。一个页面总共只有一票。所以B给A和C每个页面半票。以同样的逻辑,D投出的票只有三分之一算到了A的PageRank上。

 

对于一个页面A,那么它的PR值为:

 

PR(A) 是页面A的PR值

PR(Ti)是页面Ti的PR值,在这里,页面Ti是指向A的所有页面中的某个页面

C(Ti)是页面Ti的出度,也就是Ti指向其他页面的边的个数

d 为阻尼系数,其意义是,在任意时刻,用户到达某页面后并继续向后浏览的概率,

 

该数值是根据上网者使用浏览器书签的平均频率估算而得,通常d=0.85

版权声明:xxxxxxxxx;

原文链接:https://lecms.nxtedu.cn/yunzhuji/138438.html

发表评论:

验证码

管理员

  • 内容1196554
  • 积分0
  • 金币0
关于我们
lecms主程序为免费提供使用,使用者不得将本系统应用于任何形式的非法用途,由此产生的一切法律风险,需由使用者自行承担,与本站和开发者无关。一旦使用lecms,表示您即承认您已阅读、理解并同意受此条款的约束,并遵守所有相应法律和法规。
联系方式
电话:
地址:广东省中山市
Email:admin@qq.com
注册登录
注册帐号
登录帐号

Copyright © 2022 LECMS Inc. 保留所有权利。 Powered by LECMS 3.0.3

页面耗时0.0118秒, 内存占用338.59 KB, 访问数据库18次