function-approximation

0热度

1回答

某些值与组有很大不同，因为缺少行并且数据不连续，所以我的diffVal异常。 > df Date diffVal1 diffVal2 1 2017-05-31 04:01:00 718 483 2 2017-05-31 05:01:00 704 477 3 2017-05-31 06:01:00 741 478 4 2017-05-31 07:01:00 8

0热度

1回答

函数逼近算法中的误差界限

假设我们有一组具有“m”位尾数和“e”位指数的浮点数。假设我们想要近似一个函数“f”。从理论上我们知道通常使用“范围缩小函数”，然后从这个函数中导出全局函数值。例如让x =（sx，ex，mx）（符号exp和尾数）then ... log2（x）= ex + log2（1.mx）所以基本上范围缩小函数是“log2（ 1.mx）”。我已经实现了倒数，平方根，log2和exp2，最近我已经开始使

2热度

1回答

R中的Newtonraphson代码导致不同的结果

我需要近似Birnbaum-Saunders distr的样本参数。这里是我的代码： x =c(6.7508, 1.9345, 4.9612, 22.0232, 0.2665, 66.7933, 5.5582, 60.2324, 72.5214, 1.4188, 4.6318, 61.8093, 11.3845, 1.1587, 22.8475, 8.3223, 2.6085, 24.0875,

1热度

1回答

如何用强化学习更新函数逼近中的权重？

我的具有渐变下降的SARSA不断使指数级别的权重升级。在第4集第17步价值已经楠 Exception: Qa is nan e.g： 6) Qa: Qa = -2.00890180632e+303 7) NEXT Qa: Next Qa with west = -2.28577776413e+303 8) THETA: 1.78032402991e+303 <= -0.1 + (

4热度

1回答

Java-寻找关于计算函数的最小/最大值或步长间隔的导数的建议

寻找已经变成Java恶梦的数学问题的建议。我扫描了网页并找不到解决方案。我看过类似的计划，很遗憾找不到帮助。（我已经创建了计算Z（t）的代码）的最小值或最大值。我想要在Java中实现一个方法，它可以找到Riemann-Siegel Z（t）函数的最小值或最大值（我已经创建了计算Z（t）的代码）或其衍生物的价值。为了显示我想要做的事情，从0 < t < 100的Z（t）的图看起来像这样。直接审查

0热度

1回答

函数逼近器和优化算法之间的区别？

我刚开始学习人工神经网络和遗传算法，发现他们之间的区别在于ANN是一个函数逼近器，而GA是一个优化算法（根据SO）。问题是我不是100％确定在哪里以及如何划定这些定义之间的界限;有没有更简单的方法来解释差别在哪里使用，例如类比（假设我是10岁）？我发现特别令人困惑的是，在某些情况下，这两种类型似乎都能解决同样的问题（例如旅行推销员问题）。

1热度

1回答

逼近一个简单的sin（）函数与烤宽面条

我正在尝试烤宽面条和nolearn NeuralNet函数来近似一个简单的sin函数。毕竟，神经网络被证明是通用的逼近器，所以我想通过一个简单的非线性函数尝试千层面来实验性地显示这个事实。这是代码： import lasagne import numpy as np from lasagne import layers from lasagne.updates import nesterov

0热度

1回答

使用线性函数逼近的Q学习

我想获得一些关于如何使用函数逼近的Q学习算法的有用说明。对于基本的Q学习算法，我找到了一些例子，我想我也明白它。如果使用函数逼近，我会遇到麻烦。有人可以通过一个简短的例子来解释它是如何工作的吗？我所知道的： Istead使用矩阵，我们使用的功能和参数Q值的。使用派生函数和参数的线性组合近似。更新参数。我已经检查本文：Q-learning with function approximatio

0热度

1回答

动态环境下的强化学习与大型国家行动空间

我有一个500 * 500的网格有7个不同的惩罚值。我需要制作一个RL代理，其行动空间包含11个动作。（左，右，上，下，4个对角线方向，加速，减速和正常速度）。我怎么解决这个问题？选择的“执行操作”的概率为0.8。否则，会选择一个随机动作。而且，惩罚值可以动态改变。