日志分析-白红宇

日志分析

阅读量：7121 次

发布时间：2019-06-28

本文共 976 字，大约阅读时间需要 3 分钟。

为了对每个月的切割过的３０个日志文件统计出访问最多的ip地址进行排序，整理了下面的脚本，主要思路是处理每一个日志文件的ip排序，最后进行字典合并，计算出月ip排序。

#!/usr/bin/env python

import os

import sys

import commands

import re

ipsort = {}

def IpSort(logfile):

ipadd = r'\.'.join([r'\d{1,3}']*4)

re_ip = re.compile(ipadd)

for line in open(logfile):

match = re_ip.match(line)

if match:

ip = match.group( )

ipsort[ip] = ipsort.get(ip, 0) + 1

#return ipsort

#logfile=ipsort

#print logfile,"\n",ipsort,"\n"

#ipnum[logfile] = ipsort

def ReadFile():

filedir = raw_input("Enter the path>").strip()

filelist = os.listdir(filedir)

filenum = 0

for line in filelist:

if line[-4:] == '.txt':

IpSort(line)

#s,r = commands.getstatusoutput("cat %s/%s |awk wc -l" %(filedir,line))

def mergeipnum(*ipns):

_keys = set(sum([ipn.keys() for ipn in ipns],[]))

#print _keys,

_ipnum_dic = {}

for _key in _keys:

#pass

#print _key

_ipnum_dic[_key] = sum([ipn.get(_key,0) for ipn in ipns])

print _ipnum_dic,

ReadFile()

mergeipnum(ipsort)

转载于:https://blog.51cto.com/shantu/1439572

你可能感兴趣的文章

LeetCode 504. Base 7 (C++)

----uni-app之APP更新及静默更新----

android asmack调用MultiUserChat.getHostedRooms方法出现空指针的异常解决方案

查看>>

RE管理器root explorer基础操作教程

查看>>

TFS首次安装与配置，极其注意事项<个人备用>

当机器人具有自我知觉，并能自适应环境，真的不可怕吗？

查看>>

selenium环境搭建，浏览器驱动安装

查看>>