站点反馈:
网站主体内容都是js生成,针对用户访问,没有做优化;但是网站特针对爬虫抓取做了优化,且将图片也直接做了base64转化;然而优化后发现内容却不被百度收录。
页面质量很好,还特意针对爬虫做了优化,为什么内容反而不收录了呢?
工程师分析:
1、网站针对爬虫爬取做的优化,直接将图片二进制内容放到了html中导致页面长度过长,网站页面长度达164k;
2、 站点优化后将主体内容放于最后,图片却放于前面;
3、爬虫抓取内容后,页面内容过长被截断,已抓取部分无法识别到主体内容,最终导致页面被认定为空短而不收录。
工程师建议:
1、不建议站点使用js生成主体内容,如js渲染出错,很可能导致页面内容读取错误,页面无法抓取
2、 如站点针对爬虫爬取做优化,建议页面长度在128k之内,不要过长
3、针对爬虫爬取做优化,请将主题内容放于前方,避免抓取截断造成的内容抓取不全
候常用的网页编辑软件有Dreamweaver和FrontPage。FrontPage由Microsoft公司推出,是一个很好的网页制作入门工具,具有与Word相同的操作方式,...
我们经常看到有些网站PC和手机访问的时候显示不同的页面,而且网址是一样的,右击查看源代码也是一样的,这就属于响应式自适应的网站,那么仿制自适...
怎么仿站应该是每一个希望学习仿站的人都必须要了解的。如果不在仿站之前了解一下,仿站可能不成功,或者仿出来的网站没有真正的意义。下面仿...
1、普通型仿制型网站企业网站报价:什么上普通型建站呢?普通型建站指是只做展示公司资料及公司产品,没有什么视觉要求只是一般,这类网站叫普通型...
仿站是一种什么样的概念?仿站 顾名思意就是仿制别人的网站。为什么要仿别人的网站呢?因为如果不仿制,那么找网络公司设计一个网站,首先美工要把...
个人仿站基本各行业都会有,无非就是哪些类型仿的多,哪些类型仿的少而已。下面给大家介绍下一些常见的个人仿站类型。一、流量类站点,一般包括影...