网站首页 | 仿站联系QQ:305114474
游客,欢迎您! 请登录 免费注册 忘记密码
您所在的位置:首页 > 站内新闻 > 正文

cygwin工具常用的10个网站日志分析命令

发布日期:2020/5/21 22:43:05 浏览次数:59 加入收藏 评论:0 标签:sdcms

   不管你是ASP网站还是PHP网站,也不管你是SDCMS做的还是DEDECMS做的网站如果想更好的做好网站优化都需要学会分析网站蜘蛛爬行日志。以下是cygwin工具常用的10个网站日志分析命令,方便大家进行学习和参考。
   下面我们开始使用分析日志代码如下:
1、切割百度的抓取数据(将文件切割出来对专门的爬虫数据进行处理能提高效率)
cat log.log |grep -i ‘baiduspider' >baidu.log
2、网站状态码个数查询
awk ‘{print $9}' baidu.log|sort|uniq -c|sort -nr
3、百度总抓取量
wc -l baidu.log
4、百度不重复抓取量
awk ‘{print $7}' baidu.log|sort|uniq|wc -l
5、百度平均每次抓取的数据大小(结果是KB)
awk ‘{print $10}' baidu.log|awk ‘BEGIN{a=0}{a+=$1}END{ print a/NR/1024}'
6、首页抓取量
awk ‘$7~/\.com\/$/' baidu.log|wc -l
7、某目录抓取量
grep ‘/news/' baidu.log|wc -l
8、抓取最多的10个页面
awk ‘{print $7}' baidu.log|sort|uniq -c|sort -nr|head -10
9、找出抓取的404错误页面
awk ‘$9~ /^404$/ {print $7}' baidu.log|sort|uniq|sort -nr
10、找出抓取了多少js文件和文件抓取的次数
awk ‘$7~ /.js$/ {print $7}' baidu.log|sort|uniq -c |sort -nr



备注:部分网站模板整理自网络,如有侵权,请及时与我们沟通处理。
如若看不到文章内容及下载地址,注册免费会员既可。
更多好看的企业SDCMS模板可加QQ群:SDCMS企业模板分享 (群号:147412231) 企业模板SDCMS分享。
本文网址:http://www.hbsenbao.com/html/news/176.html
读完这篇文章后,您心情如何?
  • 0
  • 0
  • 0
  • 0
  • 0
  • 0
  • 0
  • 0
更多>>网友评论
发表评论