关于CUDA的架构（SM，SP）

我刚开始CUDA编程的人。
似乎有一个SP SM和CUDA架构的概念。
我试图运行样品来源的deviceQuery.cpp我认为工作和所处环境的SP SM发展，
它已成为不知道是哪个项目是否该SP在SM的任何项目。

关于CUDA的架构（SM，SP）

我想项目 “（14）多处理器，（8）个CUDA Cores/MP”，并且是真实的SP和SM，但是我会纠正以下的理解？

SM =多处理器= 14
SP = CUDA内核/ MP = 8个
CUDA内核= 14 * 8 = 112

顺便提及，deviceQuery.cpp的结果为以下。

CUDA设备询问（运行时API）的版本（CUDART静态链接）

检测1 CUDA功能的设备（一个或多个）

设备0：“的GeForce GTS 240
CUDA Driver版本/运行时版本5.5/5.5
CUDA能力主要/次要版本号：1.1
全局内存总量：1024兆字节（1073741824字节）
（14）多处理器，（8）CUDA内核/ MP：112 CUDA内核
GPU时钟速率：1620兆赫（1。62千兆赫）
存储器时钟速率：1100兆赫
存储器总线宽度：256位
纹理最大外形尺寸（X，Y，Z）1D =（8192），2D =（65536，32768），3
D =（2048,2048,2048）
最大分层1D纹理尺寸，（num）层1D =（8192），512层
最大分层2D纹理尺寸（num）层2D =（8192,8192），512层
常量内存总量：65536字节
每块共享内存总量：16384字节
寄存器总数ava 8192
经尺寸：768
每块的最大线程数：32
每个多处理器的最大线程数512
线程块（X，Y，Z）的最大尺寸大小：（512每块ilable ，512，64）
网格尺寸的最大尺寸的大小（X，Y，Z）：（65535，65535，1）
最大内存间距：2147483647个字节
纹理对准：256字节
并发复制和内核执行：有1个引擎的是
内核运行时间限制：小号
集成GPU共享主机内存：没有
支持主页锁定内存映射：对于表面是
对齐要求：是
设备具有ECC支持：残疾人
设备支持统一寻址（UVA）：无
设备PCI总线ID/PCI位置ID：9/0
计算模式：
<默认（多个主机线程可以使用:: cudaSetDevice（）与设备SIMU ltaneously）>

来源

2013-10-17 kuu

根据this你是正确的：

SM =流式多处理器

SP =个Streaming Processor = CUDA核心

总SP /个CUDA Cores = SM数* SP的数量/ CUDA核心每个SM

来源

2013-10-17 10:45:12 user2802841

谢谢user2802841。我明白了！ – kuu

关于CUDA的架构（SM，SP）

回答

相关问题