本文首发于知乎(实现为例进行具体展示。 1. 引言PageRank是谷歌的镇店之宝,一种用来对网络中节点的重要性排序的算法。为什么叫“PageRank”呢?一方面这个算法最初是用来对网页重要性进行排序的,另一方面它是Sergey Brin和...
如果让我们自己去做搜索的话,我们能够想到的是文章和搜索词的相关性,以此来判断这个文章是否是我们想要的,最开始的搜索有的是这样做的,还有的是按照网站的种类做个大的索引表,但是可以索引的关键字有限。 互联网上的网页估计有千百亿规模了(猜测),那...