最近折腾了个股票资讯的新站,然后site发现,虽然收录了一个首页,内容确实同服务器的一个博客的TDK,另小编百思不得其解,这是怎么回事呢?
经过一番研究发现,从百度搜索入口点击进入网站,却打不开,进入的是带有https的域名。如此基本也就明白是怎么回事了。
这个新站最早的时候做的是一个另一个题材的新闻资讯,且部署了https,后来又换了个题材,且去掉了服务器https部署和百度https认证。然而,搜索引擎收录的却依旧是https的域名还没更新过来。
又因为网站本身已经退了https的原因,搜索引擎就抓取了同ip的另一个https站点的内容展示了出来。
不得不说,百度蜘蛛也是个智障的坑,这么跨站点抓取也行?对此小编也只能去投诉了下快照,然后勤快一点的提交链接、百度地图了。什么时候能更新过来,就看运气了。