可以试想一下,模拟蜘蛛在爬行网站的时候,如何抓取,抓取到哪些内容;如果无法访问,无法抓取的东西态度,死循环,垃圾信息太多等等,那么友好度就大打折扣了。
【如何评定友好度】体现友好的地方包括:可抓取性,逻辑性、无死循环、死链少、404必备;更新。。等等。
1.正确可用的首页,具备抓取其他内容的入口及出口。无死循环。
2.良好的网站结构,逻辑、分层、网站地图脉络清晰。
3.多采用文字为链接锚文本,其次是图片;避免js链接,下拉连接等。flah是不可取的,一位内无法抓取内容,描述虽然重要但要避免使用heimao技术。
4。有效url:静态是王道,动态不可取,因为动态网页形成循环,搜索引擎出不来。所以动态网址,可能被搜索引擎忽略掉,以减少爬行消耗的时间。
5.减少音频、视频、图片的使用。
6.html代码越少越好,格式标签也同样。整个文件越小越好
7.内容越多越好。
8.CSS,Javascript等放在外部文件
9.关键词放在适当地方,来描述;告诉搜索引擎这是什么
10兼容性好。W3C标准
11.可全站抓取,用于搜索引擎大更新;并且每个页面都能区分真正的内容是哪部分。