update formate

This commit is contained in:
qinzhaoyu 2021-11-15 08:52:48 +08:00
parent d06791d2ce
commit ae3602a1cf
3 changed files with 14 additions and 12 deletions

View File

@ -10,7 +10,8 @@
主机和设备都有自己的 DRAM之间一般由 PCIe 总线连接。
GPU 计算能力不等价于计算性能;表征计算性能的一个重要参数是 **浮点数运算峰值FLOPS**
浮点数运算峰值有单精度和双精度之分。对于 Tesla 系列的 GPU双精度下 FLOPS 一般是单精度下的 1/2;对于 GeForce 系列的 GPU双精度下 FLOPS 一般是单精度下的 1/32。
浮点数运算峰值有单精度和双精度之分。对于 Tesla 系列的 GPU双精度下 FLOPS 一般是单精度下的 1/2;
对于 GeForce 系列的 GPU双精度下 FLOPS 一般是单精度下的 1/32。
影响计算性能的另一个参数是 **GPU 内存带宽(显存)**
@ -23,7 +24,8 @@ GPU 计算能力不等价于计算性能;表征计算性能的一个重要参
3. OpenACC由多公司共同开发的异构并行编程标准。
CUDA 提供两层 API即 CUDA 驱动API 和 CUDA 运行时API。
CUDA 开发环境中程序应用程序是以主机CPU为出发点的应用程序可以调用 CUDA 运行时 API、CUDA 驱动 API 和一些已有的 CUDA 库。
CUDA 开发环境中程序应用程序是以主机CPU为出发点的应用程序可以调用 CUDA 运行时 API、
CUDA 驱动 API 和一些已有的 CUDA 库。
------