2012-12-05 40 views
0

我从数据库中获取某些型号为Python:如何评估一个函数是字符串?

f(t)=(2.128795454425367)+(208.54359721863273)*t+(26.098128487929266)*t^2+(3.34369909584111)*t^3+(-0.3450228278737971)*t^4+(-0.018630757967458885)*t^5+(0.0015029038553239819)*t^6; 

其作为萨姆字符串。

我现在需要我必须手动复制这些功能和运行它们

print [1.2381648958643592 + \ 
      153.55656654019816 * t +\ 
      22.99318731025164 * (t**2) +\ 
      11.060577906796075 * (t**3) +\ 
      -1.3465054084767891 * (t**4) + \ 
      0.016926765998876842 * (t**5) +\ 
      0.001500086893490721 * (t**6) for t in range(1, 13)] 

有没有更好的办法做到这一点在Python来评估此功能t in range(1, 13)

+6

如果表达式是在Python中,那么您可以使用一些快捷方式。但是,由于它们的语言不同,所以适当的解决方案将涉及为其他语言创建解析器。 – NPE

+1

您可以使用正则表达式解析它或使用'eval',但后者在这种情况下也需要一些预处理。 –

+2

如何生成模型?有没有办法将它们生成为Python代码而不是其他语言? – abarnert

回答

1

如果性能是不是一个主要问题 - 如果你只在12点评价,我怀疑这是不是 - 那么你可以利用方便的sympy图书馆为你做很多工作。例如:

>>> import sympy 
>>> sympy.sympify("t**5 - t + 3") 
t**5 - t + 3 
>>> sympy.sympify("t**5 - t + 3").subs({"t": 10}) 
99993 

我们可以在它返回的函数等包装这件事:

import sympy 

def definition_to_function(s): 
    lhs, rhs = s.split("=", 1) 
    rhs = rhs.rstrip('; ') 
    args = sympy.sympify(lhs).args 
    f = sympy.sympify(rhs) 
    def f_func(*passed_args): 
     argdict = dict(zip(args, passed_args)) 
     result = f.subs(argdict) 
     return float(result) 
    return f_func 

,我们可以再申请,甚至超越了轻松抵达正则表达式的更复杂的情况:

>>> s = "f(t)=(2.128795454425367)+(208.54359721863273)*t+(26.098128487929266)*t^2+(3.34369909584111)*t^3+(-0.3450228278737971)*t^4+(-0.018630757967458885)*t^5+(0.0015029038553239819)*t^6;" 
>>> f = definition_to_function(s) 
>>> f(0) 
2.128795454425367 
>>> f(10) 
4230.6764921149115 
>>> f = definition_to_function("f(a,b,c) = sin(a)+3*b-4*c") 
>>> f(1,2,3) 
-5.158529015192103 
>>> import math 
>>> math.sin(1)+3*2-4*3 
-5.158529015192103 
+0

这正是我所需要的,非常感谢@DSM – daydreamer

+0

伟大的lib,但警告似乎明确警告与eval()相同的危险:http://docs.sympy.org/latest/tutorial/basic_operations .html#转换字符串到sympy表达式 – vinyll

+0

@vinyll:是的。他们沿着路径使用'eval',所以对于不可信的输入是不安全的。但是非常方便。 – DSM

0

如果你想解析“功能”的字符串,你可以做这样的事情:

import re 

s = "f(t)=(2.128795454425367)+(208.54359721863273)*t+(26.098128487929266)*t^2\ 
    +(3.34369909584111)*t^3+(-0.3450228278737971)*t^4+(-0.018630757967458885)*t^5\ 
    +(0.0015029038553239819)*t^6;" 

def f(t): 
    l = map(float, re.findall("-?\\d+\\.\\d+", s)) 
    return sum(b * t**a for a,b in enumerate(l)) 

print map(f, xrange(1,13)) 
 
[239.75206957484252, 544.337732955938, 921.544112756058, 1366.6221363666925, 1864.8848673959649, 2393.2591324279497, 2922.9192385578326, 3423.0027817028927, 3865.4085456893295, 4230.676492114911, 4514.949840987468, 4738.019242139209] 

这种方法假定该函数的字符串永远是形式的

 
c0 + c1 t + c2 t^2 + c3 t^4 + ... cn t^(n+1) 

并通过从字符串中提取浮点数并使用它们生成实际的Python函数来工作。

+1

这仍然需要从数据库“手动粘贴”? –

+0

@hayden不 - 请参阅我的编辑。 – arshajii

0

您可以将功能作为数据库蟒蛇expersion,当你得到字符串只是做类似的eval(funcstr.replace(“X”,“y值”))。

要告诉你一个例子:

funcstr = '2*x+5' 
evalpoint = funcstr.replace('x', '5') 
val = eval(funcstr) 

此时VAL进行评估,以15

+0

您可以使用这种方法来将此字符串调整为Python吗? –

0

由于NPE说,这里的正确答案是写一个解析器(和简单的解释器)为您表达语言。

,或者甚至更好,如果可能的话,产生在Python表达式摆在首位,而不是在这几乎是但不完全兼容与Python的一个子集的语言。如果语言只是一种表示多项式系数列表的方法,那么将其表示为系列列表,这将比任何实际的通用语言更容易解析。例如,假设在数据库中保存这样的:

2.128795454425367, 208.54359721863273, 26.098128487929266, 3.34369909584111, -0.3450228278737971, -0.018630757967458885, 0.0015029038553239819 

然后,执行在Python中,你可以这样做:

def eval_polynomial(polynomial, value): 
    coefficients = [float(x.strip()) for x in polynomial.split(',')] 
    return sum(coefficient * (value**exponent) 
       for exponent, coefficient in enumerate(coefficients)) 

然后:

>>> [eval_polynomial(expr, t) for t in range(1, 13)] 

但是,如果你真的,真的想在不更改数据库中的内容的情况下执行此操作,只需将其转换为Python表达式并对其进行评估即可:

>>> expr = 'f(t)=(2.128795454425367)+(208.54359721863273)*t+(26.098128487929266)*t^2+(3.34369909584111)*t^3+(-0.3450228278737971)*t^4+(-0.018630757967458885)*t^5+(0.0015029038553239819)*t^6;' 
>>> removef = re.sub(r'f\((\w+)\)=', 'lambda \1: ', expr) 
>>> fixpower = re.sub(r'(\w+)\^(\d+)', r'(\1**\2)', removef) 
>>> nosemi = fixpower.replace(';', '') 
>>> func = eval(nosemi) 
>>> [func(t) for t in range(1, 13)] 
[239.75206957484252, 544.337732955938, 921.544112756058, 1366.6221363666925, 1864.8848673959649, 2393.2591324279497, 2922.9192385578326, 3423.0027817028927, 3865.4085456893295, 4230.676492114911, 4514.949840987468, 4738.019242139209] 

但是,你可能不想这样做。

而且,如果你这样做,你可能想要写上你的实际语言的作品,而不是一个刺在这黑暗的基础上只举一个例子你的语言的猜测......

0

如果变压器你信任你的源代码,你可以用正则表达式和eval做这样的:

# deletes the simicolon and everything before the space 
my_str = start_str.split('=')[1][:-1] 
# change^to ** because that's the squared operator 
my_str = re.sub('\^', '**', my_str) 
# substitute the t for the numbers 1 to 13 and evaluate the string 
results = [eval(re.sub('t', str(t), my_str)) for t in range(1,13)]