最近一直在读谷歌的官方资料,虽然有很多内容谷歌都是点到为止,但是另外一些流露出的信息,如果仔细思考的话,我们还是能了解很多非常关键的的知识。
就比如说今天我看的这篇介绍谷歌是如何工作的官方文章,感觉收获很多,可以确认很多以前的猜想:
文章地址:https://www.google.com/search/howsearchworks/algorithms/
这篇文章细致讲解了谷歌是如何运作的,从抓取网页-索引-算法排名-实用回复等方面讲解了谷歌搜索的每一个步骤。
当然,如果你感兴趣,还可以看下谷歌使命这篇文章(使命介绍之外有很多信息对我们很有启发):https://www.google.com/search/howsearchworks/mission/
下面,我简单来说一下,这些内容带给我的一些思考和信息:
首先看下面一段:
这是讲抓取的一段内容,抓取会从网站地图开始,看到这一句我们就应该想到,如果网站没有网站地图,我们可能只能等待爬虫顺着互联网上的链接过来,但如果有网站地图,谷歌可以直接让爬虫过来,这样收录效率恐怕天差地别。第二句话,爬虫特别关注新网站、更改以及无效链接,跟什么对比,肯定是跟没有没有更改的老页面对比,所以对于老页面,谷歌很可能没有什么关注度,我们要定期对页面进行更新,这样谷歌关注度高,能让我们更快更主动的获得排名,另外,谷歌关注无效链接,那它可能可以收集无效链接的信息,如果你网站无效链接过多,对于谷歌的印象肯定是负面的。
再来看下面这一段:
谷歌抓取和索引网页的时候,关注和追踪的信息;关键词到网站新鲜度,我认为这里隐藏的信息是,最关注的是关键词,最后关注的是网站新鲜度,其中可能还包含一些其他信息,比如网页类型、网页新鲜度等等,但即使没有隐藏信息,我们也可以确定,谷歌排名因素里,网站新鲜度至少占一部分原因,不然不需要计入关键信号,当然我认为更重要的其实是网页新鲜度,我相信这也是关键信号之一。
接下来,索引的每个网页上出现的每个关键词都对应一个条目,编入索引视,添加到所有条目,这很明显,一个网页可以编入非常多条目,并在这些条目中获得排名,所以重点是如果你想让你的网页获得更多关键词排名,你就想要想办法让内容可以涵盖更多条目,同样我认为谷歌的条目是分为总条目和细分条目的,既然能区分,那它一定可以辨别什么样的内容应该获得总条目排名,什么样的内容不应该。
上面两段是我的一些思考,解读未必正确,但是我相信逻辑起码没问题,像这样可以解读的内容还有不少,希望大家可以认真看下,获得更多知识。