2013-10-17 138 views
2

我刚开始CUDA编程的人。
似乎有一个SP SM和CUDA架构的概念。
我试图运行样品来源的deviceQuery.cpp我认为工作和所处环境的SP SM发展,
它已成为不知道是哪个项目是否该SP在SM的任何项目。

关于CUDA的架构(SM,SP)

我想项目 “(14)多处理器,(8)个CUDA Cores/MP”,并且是真实的SP和SM,但是我会纠正以下的理解?

SM =多处理器= 14
SP = CUDA内核/ MP = 8个
CUDA内核= 14 * 8 = 112

顺便提及,deviceQuery.cpp的结果为以下。

CUDA设备询问(运行时API)的版本(CUDART静态链接)

检测1 CUDA功能的设备(一个或多个)

设备0:“的GeForce GTS 240
CUDA Driver版本/运行时版本5.5/5.5
CUDA能力主要/次要版本号:1.1
全局内存总量:1024兆字节(1073741824字节)
(14)多处理器,(8)CUDA内核/ MP:112 CUDA内核
GPU时钟速率:1620兆赫(1。62千兆赫)
存储器时钟速率:1100兆赫
存储器总线宽度:256位
纹理最大外形尺寸(X,Y,Z)1D =(8192),2D =(65536,32768),3
D =(2048,2048,2048)
最大分层1D纹理尺寸,(num)层1D =(8192),512层
最大分层2D纹理尺寸(num)层2D =(8192,8192),512层
常量内存总量:65536字节
每块共享内存总量:16384字节
寄存器总数ava 8192
经尺寸:768
每块的最大线程数:32
每个多处理器的最大线程数512
线程块(X,Y,Z)的 最大尺寸大小:(512每块ilable ,512,64)
网格尺寸的最大尺寸的大小(X,Y,Z):(65535,65535,1)
最大内存间距:2147483647个字节
纹理对准:256字节
并发复制和内核执行:有1个引擎的是
内核运行时间限制:小号
集成GPU共享主机内存:没有
支持主页锁定内存映射:对于表面是
对齐要求:是
设备具有ECC支持:残疾人
设备支持统一寻址(UVA):无
设备PCI总线ID/PCI位置ID:9/0
计算模式:
<默认(多个主机线程可以使用:: cudaSetDevice()与设备SIMU ltaneously)>

回答

6

根据this你是正确的:

SM =流式多处理器

SP =个Streaming Processor = CUDA核心

总SP /个CUDA Cores = SM数* SP的数量/ CUDA核心每个SM

+0

谢谢user2802841。我明白了! – kuu