如何通过组合多个CPU内核,例如在Google Compute Engine n1-highmem-64机器类型上培训自定义神经网络(不是tensorflow)来获得单线程更快的处理速度, CPU核心?群集电脑还是什么?不知道从哪里开始......谢谢!使用附加内核的CPU性能
-3
A
回答
0
那么你是要求单线程,但多核心更快的速度。
让一个单一线程拥有更快处理速度的唯一可行方法就是超频。通过获得更新的内核,您也可以获得更好的芯片组。
要完成这个简单的工作是不可行的,你可能需要将固件打补丁到几个组件,以允许它们在一个线程上利用L3缓存或其他东西在cpus上进行通信....非常不可行。
与此相反的是要走的路。
多线程用于在多个内核上并发处理不同的数据。
通用GPU的用途是通过将计算迁移到GPU来对大量数据执行相同的操作。它增加了开销时间,但是当输入足够大时会给出好的结果。
有趣的是,你提到不是TensorFlow,因为它实际上实现了这两个。
即使你能够实现像这样的东西,它可能只是对原子锁进行打乱,除非你已经对它进行了线程化。
编辑
如果您正在寻找使用软件即服务,亚马逊(https://aws.amazon.com/tensorflow/和其他公司)有一系列能与出来的各种深学习/机器学习框架兼容的服务框。
相关问题
- 1. 添加附加内核或CPU不会改善性能的地方在哪里?
- 2. 调用GPU内核后CPU性能下降
- 3. 多核CPU上的Redis性能
- 4. 使用ThreadPoolExecutor的CPU性能
- 5. CUDA内核与Julia集CPU版本的性能下降
- 6. 在CPU内核数
- 7. 限制Caffe CPU内核使用率?
- 8. 使用javac多个CPU内核
- 9. 使用附加的HTML性能改进
- 10. 增加与性能直接相关的CPU核心?
- 11. 如果我有不同类型的内核,如何测量CPU单核性能?
- 12. 多核CPU能力
- 13. 读取多核CPU的CPU使用率
- 14. 的Node.js - 针对CPU内核
- 15. MySQL:慢日志;附加CPU使用率
- 16. Python附加性能
- 17. 内核/用户模式下的CPU
- 18. 性能问题:单个CPU核心与单个CUDA核心
- 19. 性能问题 - 越来越多的内存和CPU使用
- 20. 多核和CPU使用
- 21. Cassandra CPU性能
- 22. CPU usage_slow性能
- 23. cpu屏蔽和禁用内核中断
- 24. 使用附加模块交叉编译Linux内核
- 25. 在Linux中使用pthread中的可用物理CPU内核
- 26. 安卓工作室性能与CPU内核数量的比例是否良好
- 27. spin_lock和spin_unlock是否会损害单CPU机器上SMP内核的性能?
- 28. 关于性能(内存或CPU)
- 29. 从MATLAB调用内核低性能
- 30. mysqld性能高cpu和内存使用率
好的,所以我运行的代码有一个准备阶段,在这个阶段中数据被分类和清理,但是然后是更加强化的训练阶段,在整个时代非常重复,但计算只是总结输出激活的分数......有没有办法从单线程开始,但是一旦到达这个训练阶段,通过将时期分成64个部分(或可用的CPU数量)来计算激活并将总和返回到单个线程?除了在训练之前准备好并存储在RAM中之外,时代节不相互依存...... –
如果您可以在python中实现数据清理,那么您可以在Tensorflow中实施培训,并且它会自动使用所有内核/超线程或gpus。如果不是,则必须在模型的前向和后向传播步骤上实现多线程,然后对损失函数执行求和并使用该求和来调整权重矩阵。 – Zroach
绝对不使用Python,Node JS –