2008-12-22 61 views
24

如何使用正则表达式从字符串中提取double值。提取float/double值

import re 

pattr = re.compile(???)  
x = pattr.match("4.5")  
+0

你能否提供一些细节为什么你不能使用float(“4.5”)? – jfs 2008-12-22 04:41:00

回答

20

这里是最简单的方式。不要将正则表达式用于内置类型。

try: 
    x = float(someString) 
except ValueError, e: 
    # someString was NOT floating-point, what now? 
+0

其实,这也是最安全的方式。考虑一些错误的输入,比如`0..1`,`0.0.02`,正则表达式很难识别它。更糟糕的是,它会假装它是正确的,并产生一些错误的答案。 – dspjm 2016-11-15 06:07:41

+0

技术上正确,但问题显式指定了regexp。 – VillasV 2017-01-07 15:48:20

45

perldoc perlretut一个RegExp:

import re 
re_float = re.compile("""(?x) 
^
     [+-]?\ *  # first, match an optional sign *and space* 
     (   # then match integers or f.p. mantissas: 
      \d+  # start out with a ... 
      (
       \.\d* # mantissa of the form a.b or a. 
     )?  # ? takes care of integers of the form a 
     |\.\d+  # mantissa of the form .b 
    ) 
     ([eE][+-]?\d+)? # finally, optionally match an exponent 
    $""") 
m = re_float.match("4.5") 
print m.group(0) 
# -> 4.5 

要从一个更大的字符串中提取数字:

s = """4.5 abc -4.5 abc - 4.5 abc + .1e10 abc . abc 1.01e-2 abc 
     1.01e-.2 abc 123 abc .123""" 
print re.findall(r"[+-]? *(?:\d+(?:\.\d*)?|\.\d+)(?:[eE][+-]?\d+)?", s) 
# -> ['4.5', '-4.5', '- 4.5', '+ .1e10', ' 1.01e-2', 
#  '  1.01', '-.2', ' 123', ' .123'] 
+2

findall表达式是业务,谢谢 – reabow 2015-01-27 13:29:44

1

作为蛮力的正则表达式的浮点数。还有的版本JF塞巴斯蒂安的差异较小:

import re 
if __name__ == '__main__': 
    x = str(1.000e-123) 
    reFloat = r'(^[+-]?\d+(?:\.\d+)?(?:[eE][+-]\d+)?$)' 
    print re.match(reFloat,x) 

>>> <_sre.SRE_Match object at 0x0054D3E0> 
+0

这不匹配没有整数部分的浮点数,例如`.123`而不是`0.123`。 – 2013-05-02 11:57:22

9

对于解析int和float(点分离)值:

re.findall(r'\d+\.*\d*', 'some 12 12.3 0 any text 0.8') 

结果:

['12', '12.3', '0', '0.8']