我试图清理日志文件中的Splunk对其进行分类,所以我的问题是:PCRE正则表达式:如何将lookahead与以下目的结合使用?
^(我?)(?:[^] *){8} (((P. +?)? = \ d {8} \ d {8} \ d {10})|。?。?(= \ d {8}))
粗体区域需要被组合等的if/else,[它选择之前粗线]
我希望它停止之前刚刚8个数字和点(DDDDDDD)OR 8digit_8digit_10digits(8xd_8xd_10xd。)
我的任务就是好摆脱日志文件上的所有唯一编号,我可以更好地对其进行分类。
请帮助
您能提供一个期望的输入和输出示例吗? – CAustin
输入: 时间戳:2/26/2014 4:00:42 PM SN#7消息:ServerXYZ:AppXYZ未能获取响应12345678的活动代码。 时间戳:2/26/2014 3:37:42 PM SN# 31消息:Error复制文件夹,下面的异常被抛出IOException异常:该进程无法访问该文件12345678_12345678_1234567890' 输出:应该是指 AppXYZ未能抢响应 错误复制文件夹活动代码,以下异常被抛出IOException异常:进程无法访问文件 我不希望有唯一的编号字段,我可以执行一些统计信息,例如我的网站上有哪些类型的错误。 –
akemko
你究竟在哪里试图从**中捕获**?从正则表达式看起来像'Message:---(停在那些数字)'。这个'(?:[^] * []){8}'不推荐。还有什么是'^'插入符号,线或字符串的开头? – sln