我想训练一个非常大的模型。因此,我只能将非常小的批量放入GPU内存。使用小批量处理的结果非常有noisy gradient estimations。
我能做些什么来避免这个问题?Caffe:如果只有一小批适合内存,我该怎么办?
11
A
回答
9
您可以在求解器参数中更改iter_size
。 Caffe在每个随机梯度下降步骤中通过iter_size
x batch_size
实例累积梯度。 因此,如果由于内存有限无法使用较大的batch_size,那么增加iter_size
也可以获得更稳定的渐变。
4
相关问题
- 1. 如果我想在内存缓存中存储一个None值,该怎么办?
- 2. 如果对象在Handlebars.js中只有一个值,该怎么办?
- 3. 如果抛出IOException,我该怎么办?
- 4. 如果我需要零大小的阵列,我该怎么办?
- 5. Caffe:如何选择适合内存的最大可用批量大小?
- 6. 如果我知道Windows内核,我该怎么办?
- 7. 我该怎么办?
- 8. 如果在POM中只有父版本,该怎么办?
- 9. 如果我有一个演员,该怎么办应该有很大的节奏?
- 10. Erlang DETS有多大?如果它太小,该怎么办?
- 11. 如果我需要修改凉亭的内容,该怎么办?
- 12. 我该怎么办这个效果?
- 13. Matlab曲线拟合不适用于较小的值(1e-12),我该怎么办?
- 14. 如果帖子Meta不存在,我该怎么办?
- 15. 如果JPA真的只是一个规范,那我们该怎么办?
- 16. 如果我使用mmap而不是malloc分配内存,该怎么办?
- 17. 如果我没有上下文,该怎么办?
- 18. 如果IE上没有任何支持,我该怎么办?
- 19. 怎么办内复合键
- 20. 我该怎么办日期
- 21. 我该怎么办用C
- 22. GWT JDBC我该怎么办?
- 23. “ConnectionResetError”我该怎么办?
- 24. SSL - 我该怎么办?
- 25. 我该怎么办在PHP
- 26. 如果setuptools未安装,该怎么办?
- 27. 如果google.load失败,该怎么办?
- 28. 如果DBCursor未关闭,该怎么办?
- 29. 如果mysql_query()失败,该怎么办?
- 30. 如果collections.defaultdict不可用,该怎么办?
相关:http://stats.stackexchange.com/q/201775/66467 – Shai