-4
A
回答
4
我已经already answered这在以前的问题(见最后段落),但我会再试一次。
与sum(θ)
正规化的问题是,可能必须互相抵消的
实施例θ参数:
θ_1 = +1000000
θ_2 = -1000001
的sum(θ)
这里是百万-1000001 = -1是小
sum(θ²)
是1000000²+(-1000001)²这是非常大的。
如果您使用sum(θ)
,您可能会因没有正规化(这是目标)而导致避免正则化的θ值过大,因为这些项互相抵消。
根据您的搜索/优化算法,您可以使用sum(|θ|)
。但我知道θ²(L2标准)很受欢迎,并且在梯度下降方面效果很好。
+0
另一个原因是它通过惩罚较大的系数来提供额外的正则化。如果θ很大,那么θ^ 2将会很大,因此θ的较大值将受到惩罚。所以,这种正则化偏好比sum(|θ|)'更小的theta值 –
相关问题
- 1. 了解cos(θ)和正弦(θ)
- 2. 对于无向图,为什么邻接表表示的内存要求是θ(V + E)而不是θ(V + 2E)?
- 3. 2 = theta(1 + 1/n)^ n;为什么是一个恒定的θ?
- 4. 解释nC2是如何在Θ(n^2)
- 5. 答案是:n! =Θ()?
- 6. 如果klgk =Θ(n),那么k =Θ(n/lgn)
- 7. n≠Θ(logn)?
- 8. 紧(Θ)绑定
- 9. 递归函数的大θ(Θ)运行时间
- 10. 运行时间使用大Θ符号
- 11. 我可以说Θ(n^3/2)时间算法渐近地比Θ(n log n)时间算法慢吗?
- 12. 写有Θ(nlogn)的算法
- 13. 大-θ,时间复杂度
- 14. f(n)=Θ(f(n))是真的吗?
- 15. 为什么我们需要正规化训练MaxEnt?
- 16. 梯度下降:θ驱动不收敛
- 17. 为什么我们不使用Repeater Control而不是Gridview Control?
- 18. 为什么我们不使用lite-server而不是Gulp?
- 19. 为什么我们使用HTTP而不是远程调用?
- 20. 为什么我应该使用goog.ui.Checkbox而不是常规输入?
- 21. 为什么我应该使用content_tag而不是“常规”html?
- 22. 为什么我们使用`#include“stdafx.h”`而不是`#include <stdafx.h>`?
- 23. 为什么我们主要使用LocalDB而不是SQL Server?
- 24. 为什么我们使用`as foo(geom)`而不是`As geom`
- 25. 为什么我们使用接口而不是协议?
- 26. 为什么我们使用ApacheHttpClient而不是HttpURLConnection?
- 27. 为什么SQLBRITE和我们为什么使用它而不是SQLite?
- 28. 如何使用求和符号证明算法是Θ(log n)?
- 29. 当我们提取请求时,为什么我们使用Like而不是==?
- 30. 为什么我们不使用2-3或2-3-4-5树?
@Ami你怎么知道他的意思| theta |?是的,使用| theta |是有意义的而不是“theta”,但声称别人的问题是在黑暗中拍摄。 – lejlot
@lejlot回想起来,你是对的。 (尽管如此,它仍然是一个错误的堆栈交换问题)。 –