seo优化人员怎么去了解百度搜索引擎的“内部消息”?一般的方法是查资料,看视频,和seo同行人员交流,以求获得尽可能准确的信息,实际上,这些方法的作用不大,价值也很小。百度站长seo平台,为seo工作人员提供更权威的信息,更为科学。
数据工具主要涵盖的是:搜索引擎的官方数据,例如百度索引值、百度抓取频率等,还有网站的本身数据,例如网站流量等,还有外部工具计算数据,例如爱占权重计算等。
学习最重要的核心:
1:明白每一个位置展现的数据是什么意思,代表你的网站怎么了,每一个数据的变动代表怎么了
2:明白多个数据之间互相相加带来的意思是什么,多个数据变动,相加带来的意思是什么——例如:抓取异常+抓取频率短时间增加=网站可能要降权。
百度站长平台:
一个特殊工具。本工具本身不涉及流量等数据展示,只是网站在百度的一些本身的数据,例如抓取频率等数据。
第一:连接提交:网站本身蜘蛛不多,网站层次好几层,靠本身的蜘蛛来源很少,这个情况下我们可以提交连接直接给百度,直接引导蜘蛛来我们的网站做收录的提升。
蜘蛛来源的方式:ip来源,较少,新站收录的原因。外部链接的引导,提交连接给搜索引擎。
操作区别:
自动程序提交:主动推送和自动推送————程序推送————效果极差
sitemap提交:最好的,可以抓到你的所有的连接,最重要的是,这一步操作,是SEO人员的可控操作。
注意事项:1:每一个地图不要超过2000个连接,超过了百度不好爬行和抓取,第二可以分多个地图文件,但是里面的链接都是一样的,例如做 sitemap.xml sitemap.txt 等做蜘蛛的重复爬行。
单个连接提交:百度入口提交
提交的注意事项:
1:当你网站进行改版、或者任何大的操作,你不希望百度快速爬行网站快速抓取评分进行打击你的网站,那么不要做提交。(你改版位置的多少,你改版页面的多少,你改版位置的权重高低判定。)
2:新站最好不要做提交,避免百度真的收录了很多的页面,新站如果收录太多页面,如果导致分权,首页排名上不去,新站权重很低,收录多一半排名也不好。让百度慢慢收录到了100.200.等数据,已经产生流量,可以带来权重的时候,再提交,用产生的权重弥补收录分权。
两种特殊的操作:慎用
1:如果人为地让网站在短时间内打不开,会导致网站的抓取频率短时间内大量增加,增加收录一次性很多。
2:如果设置蜘蛛爬行识别操作,一旦识别蜘蛛来了以后又走了,马上让爬行过得页面为404.会导致网站的这个页面快速的收录和蜘蛛的引导操作。
以上有可能带来降权,慎用。
第二:原创保护、熊掌号、品牌保护————已经无用
第三:移动端适配规则编写
适配:你有pc端,你再做一个移动端,移动端打开是调用pc的内容,且根据移动端设备的屏幕大小不同,页面大小,样子也会不同。
两种方式:H5适配 代码适配
适配规则的编写:
意思:提交你的pc连接给百度,让他明白你的移动端打开之后,连接是什么样子。
就算是你具备H5适配,但是要注意www.baidu.com和 m.baidu。com 不是一个域名,如果你只是代码适配,两个域名调用一个页面内容,也有可能打击,所以最好也要做上百度规则适配,让百度明白这是一个站点。
让百度判定你的pc端和移动端之间的关系
例如:
pc端连接是:
www.baidu.com/hui/123.html ————这个端口中共有几层,每一层的组成方式是什么
M端:m.baidu.com/hui/123.html ——————告诉百度 我从pc变成移动后,连接的层次哪些会变
写为:
pc端连接是:www.baidu.com/([a-z]+)/(\d).html ————这个端口中共有几层,每一层的组成方式是什么
M端:m.baidu.com/${1}/${2}.html
www.baidu.com/hui/ht-123.html www.baidu.com/([a-z]+)/([a-z]+)-(\d).html
m.baidu.com/hui/ht-123.html m.baidu.com/${1}/${2}-${3}.html
适配提交方式:
PC URL表达式:这里写的是你的文章链接最深的层次链接的适配规则。
提交验证URL对:这里是包含在上面的规则中的url连接,你上面写三层你的网站链接,下面你放什么连接,都包含在上面的规则中了。
网站做适配,收录太少的情况下不适合做适配,就算是你规则写对了,适配也过不去。收录一般最少50到100才可以。
mip、amp——移动端打开加速
你想做加速,你要把你的域名解析到加速的那个服务器地址(做百度cdn,你要把域名解析到百度给你的服务器地址)————百度会自动缓存你的页面——用户点击打开,其实打开的不是你的站,而是百度提前缓存的你的页面,你是通过直接读取百度缓存打开,速度回快的的,也是因为这个情况,导致做了cdn等加速,搜索引擎收录会更好,就是因为他会提前爬行更多抓取做缓存。
死链提交:
当你的网站出现死链接,打不开的连接,你不提交,百度爬行到后,会判定你的内部资源丢失,进行打击,你做了提交,百度会认为你知道这个是死链,是必须存在的类似程序一类的死链接,不是资源丢失,会减少你的因为死链降低的评分。
方式:挖掘出你的所有的死链接,做一个txt文档,放在你的根目录,然后提交 你的域名/死链文档.txt
索引量:百度数据库对你的网站的缓存收录,但是不是等于快照,一般高于site后的快照数据
流程:
页面存在——百度抓取——评分合格的放进去索引库——再次评分合格的放出形成快照收录
也可以从索引值看出你的网站的一个权重的上升和下降。
抓取频次:
搜索引擎一段时间内对网站的抓取次数,一般来说网站抓取次数不会有太大的波动,例如从100一天内到5000,一般来说正规优化,抓取频次会慢慢地自然上升,如果抓取频次出现很大的波动,就说明你的网站正在被频繁抓取,要么就是服务器出错百度尝试打开页面,要么就是网站优化错误导致要降权,正在评分计算是否降权。
所以:一旦抓取频率出现很大的波动,基本上说,网站要出事。
抓取诊断特殊点:
每周可以抓取200次左右,抓取诊断是百度判断可以不可以抓取到你的网站的一个操作,每一次的尝试抓取诊断,都可以判定为你的网站正在被百度蜘蛛爬行,所以更新少的话,可以每次更新后,来这里放上你的内容链接做一次抓取诊断来让百度蜘蛛进行爬行。
Robots:
意思是允许或者不允许百度对你的某些或者针对性的页面进行爬行,但是要注意,你写了robots,首页还是会收录,只是不会展现你的快照,但是还是会展现你的标题,所以上线前用Robots来避免百度收录,是不对的,还是收录,你改变内容,还是会判断你的网站改版。
User-agent: *
Disallow: /plus/ad_js.php
Disallow: /plus/advancedsearch.php
Disallow: /plus/car.php
Disallow: /plus/carbuyaction.php
Disallow: /plus/shops_buyaction.php
Disallow: /plus/erraddsave.php
Disallow: /plus/posttocar.php
Disallow: /plus/disdls.php
Disallow: /plus/feedback_js.php
Disallow: /plus/mytag_js.php
Disallow: /plus/rss.php
Disallow: /plus/search.php
Disallow: /plus/recommend.php
Disallow: /plus/stow.php
Disallow: /plus/count.php
Disallow: /include
Disallow: /templets
Disallow: /404.html
User-agent: ————是否允许那些蜘蛛进行抓取页面 使用* 就是允许所有的蜘蛛
Disallow:不允许抓取的页面
例如:
Disallow:/*123
不允许百度对主域名下任何的一个带有 123连接的页面进行抓取,但是 带有 /任何1234 等都可以抓取。
主要两个点做robots:1:类似后台或者用户注册页面等保密页面,不希望百度收录。 2:对于某些低质量页面,类似404空白页面,不允许抓取避免百度评分下降。3:类似一些程序方面,例如js文件 php文件不允许抓取。
https认证:
新站可以做,老站不建议把http换成https,这样操作会导致百度判定你连接改版而降权。
站点LOGO:
搜索结果左侧展现图片两种方式:1 logo提交后 2用户搜索文字,所处于的页面中,有一张图,图中有alt属性为用户搜索文字,也可以随机百度抓取展现。
连接分析:
死链分析和外链分析
外链分析:
domain查询结果不是外链,是相关域查询,真正的对网站有效的,百度评定对网站有效的外部链接,是站长平台的外链分析数量。
网站改版:
你把一个站改成另外一个站的域名,两个域名之间的关系,写清楚,让百度判定你确实是进行了网站两个域名之间的更换,这样最小的限度让百度因为你的域名改版而打击你的网站。两个链接站点,进行和适配一样的正则表达式说明。
闭站保护:
当你的网站因为某种原因例如别人攻击刷流量等,你怕百度打死你的站点,那么你可以先把网站申请闭站保护,但是一定要注意:
1:申请之前,先关闭网站或者服务器,不然申请不通过
2:闭站期间不要超过180天。
3:虽然百度说闭站了,不会降低你的评分,但是每一次做闭站,都一定会降低评分甚至降权,所以不到万不得已,不要做。