update formate
This commit is contained in:
parent
d06791d2ce
commit
ae3602a1cf
|
@ -10,7 +10,8 @@
|
|||
主机和设备都有自己的 DRAM,之间一般由 PCIe 总线连接。
|
||||
|
||||
GPU 计算能力不等价于计算性能;表征计算性能的一个重要参数是 **浮点数运算峰值(FLOPS)**。
|
||||
浮点数运算峰值有单精度和双精度之分。对于 Tesla 系列的 GPU,双精度下 FLOPS 一般是单精度下的 1/2;对于 GeForce 系列的 GPU,双精度下 FLOPS 一般是单精度下的 1/32。
|
||||
浮点数运算峰值有单精度和双精度之分。对于 Tesla 系列的 GPU,双精度下 FLOPS 一般是单精度下的 1/2;
|
||||
对于 GeForce 系列的 GPU,双精度下 FLOPS 一般是单精度下的 1/32。
|
||||
|
||||
影响计算性能的另一个参数是 **GPU 内存带宽(显存)**。
|
||||
|
||||
|
@ -23,7 +24,8 @@ GPU 计算能力不等价于计算性能;表征计算性能的一个重要参
|
|||
3. OpenACC,由多公司共同开发的异构并行编程标准。
|
||||
|
||||
CUDA 提供两层 API,即 CUDA 驱动API 和 CUDA 运行时API。
|
||||
CUDA 开发环境中,程序应用程序是以主机(CPU)为出发点的;应用程序可以调用 CUDA 运行时 API、CUDA 驱动 API 和一些已有的 CUDA 库。
|
||||
CUDA 开发环境中,程序应用程序是以主机(CPU)为出发点的;应用程序可以调用 CUDA 运行时 API、
|
||||
CUDA 驱动 API 和一些已有的 CUDA 库。
|
||||
|
||||
------
|
||||
|
||||
|
|
Loading…
Reference in New Issue