发布日期:2022-11-30 浏览次数:256
做SEO优化都知道百度搜索资源平台是百度为客户做好搜索引擎优化而提供的各种工具和服务,在百度搜索资源平台我们可以统计网站数据,查看索引量,流量和关键词等很网站多数据。
1、提交网站数据
普通收录:通过工具或者手动方式向百度主动推送站内资源,提高网站收录,缩短爬虫爬取到资源的时间。
普通收录三种提交方式
方式 | 配额 |
API提交 | 两种形式是共享配额(具体额度,开通后可以看) |
手动提交 | |
sitemap | 平台基于站点资源质量和搜索用户喜欢程度综合评估计算站点提交配额,站点不同,提交配额也可能不同。开发者可以在平台工具“资源提交-普通收录-sitemap提交”界面,查看普通收录工具的天级提交配额和存量文件配额。 |
1)API提交方式
2)手动提交方式
3)sitemap文件提交
注意事项:
三种提交方式每日都有固定配额,可以根据内容,在固定配额内选择推送资源
4)数据反馈
可以查看每个提交方式,每天提交的数量
2、快速收录
网站快速收录工具,可以直接想百度主动推送网站资源,大大缩短爬虫抓取网站链接时间,一般情况下48小时即可收录。
注意事项:
仅限于提交移动端页面以及移动端自适应页面,判断是否符合移动体验标准请参考《百度搜索优质内容指南》及《百度APP移动搜索落地页体验白皮书5.0》,请确保所提交链接的协议头和自己网站一致。
1)快速收录—数据反馈
页面查看当天累计提交的链接去重后,已收录量和未收录量数据
3、死链提交
死链工具是把网站内部的死链提交给百度,提交后的链接会被百度搜索屏蔽,有利于网站评级
注意事项:
文件地址格式为txt或xml,每个地址文件最多包含50000个网址且需小于10MB;
如果验证了网站的主域,那么sitemap文件中可包含该网站主域下的所有网址;您每次最多可提交20条文件地址;
仅识别404数据,请勿提交非死链内容;如误使用本工具,且站点内容不为死链,则提交不会生效。
1)数据反馈
”死链提交—数据反馈”板块查看死链文件状态和死链处理状态。
4、移动适配
如果你的网站有pc和手机站,而且两个网站内容相对应,完全相同,可以在移动适配工具进行对应关系提交(自适应站点不需要提交)
1)适配方式
适配方式 | 提交内容 | 提交数量 | 周期 | 适用情况 |
规则适配 | PC-移动正则表达式 | 单条或多条正则规则,最多提2000对规则表达式 | 短 | 一次提交可对于新增同规则的URL持续生效,无需多次反复提交,便于问题排查和维护 |
URL适配 | 上传URL对文件 | 一次至多10个文件(小于10MB),不超过5万个URL | 长 | 无法用正则表达式表达URL关系的情况 |
填写URL对 | 至多2000对 |
2)状态反馈
提交适配规则之后,开发者们可以在”移动适配“工具页面中查看处理状态;一共会出现8种情况。
校验中
校验失败:原因可能是页面不相似/移动页不友好/含有死链链接/PC页面或移动页面没有收录/数据校验失败等
校验成功
校验部分成功
未达到校验标准:原因可能是页面未收录或者展现过少 适配成功
适配部分成功
内容重复
5、索引量
索引量工具可以支持查看总索引量,同时支持站点自定义想要关注的目录,查看某一目录规则下的索引量。
更新频率:百度索引数据最快每天更新一次,最迟一周更新一次,不同站点的更新日期可能不同。
索引量不是网站的流量,而且索引量数据会有周期性波动,10%以内属于正常现象,有时候甚至更多。
6、流量与关键词
统计网站热门关键词在百度搜索中的展现和点击的数据,同事也提供关键词定制功能,方便用户根据需求关注重点关键词数据
7、抓取频次
搜索引擎在一天内对网站抓的次数
Baiduspider会根据服务器压力自行调整抓取频次
抓取过大会影响服务器稳定,抓取过小会影响网站收录
抓取频次也可以自动设置
8、抓取诊断
从百度蜘蛛的视角查看抓取内容,自助诊断百度蜘蛛看到的内容和预期是否一致
抓取是区分pc端和移动端的数据,每周有70次的使用次数抓取结果只显示百度蜘蛛课件的前200KB内容,抓取失败可以重新检测,同时请检查网站是否正常访问
1)抓取异常
DNS异常
Baiduspider无法解析网站的ip就会出现DNS异常情况,可以检查IP地址,或者域名服务商是否把Baiduspider封禁
连接超时
抓取请求连接超时,可能是因为服务器过载或者网络不稳定。
抓取超时
抓取请求连接建立后,下载页面速度过慢,导致超时,还可能是因为服务器过载,带宽不足。
连接错误
无法连接或者连接建立后对方服务器拒绝。
服务器错误:响应代码——5XX
访问被拒绝:响应代码——403
找不到页面:响应代码——404(百度会自动进行死链屏蔽)
其他错误:响应代码——4XX(不包括403和404)
9、robots
robots.txt主要是声明网站的那些页面不能被抓取,那些页面可以被抓取,通过robots工具创建、校验、更新您的robots文件,或查看您网站robots文件在百度生效。
如希望收录网站上所有内容,请勿建立robots.txt文件;
Robots工具目前支持48k的文件内容检测,请保证您的robots.txt文件不要过大,目录最长不超过250个字符。
放置在网站根目录下,比如http://www.baidu.com/robots.txt