1、简单明?jin)的|站l构

Spider抓取相当于对webq个有向图进行遍历,那么一个简单明?jin)结构层ơ分明的|站肯定是它所喜欢的,q尽量保证spider的可L?/P>

Q?Q树(wi)型结构最优的l构即“首—频道—详情页”;

Q?Q扁q首到详情늚层次量,既对抓取友好又可以很好的传递权重?/P>

Q?Q网状保证每个页面都臛_有一个文本链接指向,可以使网站尽可能全面的被抓取收录Q内铑־讑֐样对排序能够产生U极作用?/P>

Q?Q导航ؓ(f)每个面加一个导航方便用L(fng)晓所在\径?/P>

Q?Q子域与目录的选择怿有大批的站长Ҏ(gu)有疑问,在我们看来,当内容较?yu)ƈ且内容相兛_较高时徏议以目录形式来实玎ͼ有利于权重的l承与收敛;当内定w较多q且与主站相兛_略差时徏议再以子域的形式来实现?/P>

2、简z美观的url规则

Q?Q唯一性网站中同一内容只与唯一一个url相对应,q多形式的url分散该面的权重,q且目标url在系l中有被滤重的风险;

Q?Q简z性动态参数尽量少Q保证url量短;

Q?Q美观性得用户及(qing)机器能够通过url卛_判断出页面内容的LQ?/P>

我们推荐如下形式的urlQurl量短且易读使得用户能够持箋理解Q例如用拼音作为目录名Uͼ同一内容在系l中只生唯一的url与之对应Q去掉无意义的参敎ͼ如果无法保证url的唯一性,量使不同Ş式的url301到目标urlQ防止用戯错的备用域名301至主域名?/P>

3、其他注意事?/P>

Q?Q不要忽略倒霉的robots文gQ默认情况下部分pȝrobots是封搜索引擎抓取的Q当|站建立后及(qing)时查看ƈ书写合适的robots文gQ网站日常维护过E中也要注意定期(g)查;

Q?Q徏立网站sitemap文g、死链文Ӟq及(qing)旉过癑ֺ站长q_q行提交Q?/P>

Q?Q部分电(sh)商网站存在地域蟩转问题,有货无货l一做成一个页面,在页面中标识有无货即可,不要此地区无货即q回一个无效页面,׃spider出口的有限性将造成正常面无法收录?/P>

Q?Q合理利用站长^台提供的robots、sitemap、烦(ch)引量、抓取压力、死链提交、网站改版等工具?/P>