当前位置:建站首页 > IDC > 虚拟主机 > 正文

网站日志文件分析方法精华版

时间:2013-09-08 19:05 来源:未知 作者:admin 阅读:

网站源码     淘宝学堂     云服务器     独立IP空间     5元注域名    

经太过析站点日记Log文件我们可以看到用户和搜索引擎蜘蛛拜访网站的举止数据,这些数据能让我们阐发出用户与蜘蛛对站点的喜好以及站点的健康环境。在站点日记阐发中,咱们首要需要赏析的是蜘蛛举止。

在蜘蛛爬取及收录过程中,搜寻引擎会给特定权重站点分拨响应的资源量。一个搜寻引擎朋友型的站点理应虚浮操作这些资源,让蜘蛛可以急迅、精确、周全的爬取有价格、用户爱情的形式,而不撙节资源在无用的、走访异常的内容上。

但由于web日志中数据量过大,所以咱们一般需要凭借web日记赏析工具来检查。经常使用的日记阐发工具有:光年日记解析工具、web log exploer。

在 赏析日记时,对于单日日志文件咱们需要解析的形式有:接见次数、搁浅岁月、抓取量、目次抓取统计、页面抓取统计、蜘蛛接见IP、HTTP状态码、 蜘蛛纳闷时段、蜘蛛爬取路子等;对于多日日记文件咱们需要剖析的内容有:蜘蛛会晤次数趋向、搁浅时日趋向、个人抓取趋势、各目次抓取趋向、抓取年华段、蜘 蛛烦懑周期等。

下面小脑袋直通车竞价软件小编来看看网站日记若何解析?

网站日记数据剖析解读:

1、接见次数、进展岁月、抓取量

从这三项数据中咱们可以获悉:均匀每次抓取页面数、单页抓取停留岁月和平均每次搁浅岁月。

匀称每次抓取页面数=总抓取量/走访次数

单页抓取停顿=每次停顿/每次抓取

平均每次停留年华=总搁浅时间/会晤次数

从 这些数据我们可以看出蜘蛛的生动程度、亲和程度、抓取深度等,总会见次数、进展光阴、抓取量越高、平均抓取页面、平均搁浅时间,剖明站点越受搜寻 引擎喜欢。而单页抓取停顿时间诠释站点页面拜访速率,时间越长,抒发网站接见速度越慢,对搜索引擎抓取收录较有利,咱们应只管即便行进网页加载速度,削减 单而立进展时间,让爬虫本钱更多的去抓取收录。

(编辑:admin)

版权申明:本站文章部分来自网络,如有侵权,请联系QQ:929594696 谢谢!
更多相关内容请关注www.jz256.com

顶一下
(0)
0%
踩一下
(0)
0%

热门栏目

阅读排行