Cuda Programming Guide
Ctrlk
  • Introduction
  • Chapter 1 简介
    • 1.1 从图形处理器到通用并行计算
    • 1.2 CUDA
    • 1.3 可扩展编程模型
    • 1.4 Document Structure
  • Chapter 2 编程模型
    • 2.1 核函数
    • 2.2 线程层级
    • 2.3 内存层级
    • 2.4 异构编程
    • 2.5 异步SIMT编程模型
    • 2.6 计算能力
  • Chapter 3 编程接口
    • 3.1 用NVCC编译
    • 3.2 CUDA
    • 3.3 版本和兼容性
    • 3.4 计算模式
    • 3.5 模式转换
    • 3.6 Windows上的Tesla计算集群模式
  • Chapter 4 硬件架构
    • 4.1 SIMT 架构
    • 4.2 硬件多线程
  • Chapter 5 性能指导
    • 5.1 总体性能优化逻辑
    • 5.2 最大化利用率
    • 5.3 最大化内存吞吐
    • 5.4 最大化指令吞吐
    • 5.5 最小化内存抖动
Powered by GitBook
On this page
  1. Chapter 4 硬件架构

4.1 SIMT 架构

Previous3.6 Windows上的Tesla计算集群模式Next4.2 硬件多线程

Last updated 2 years ago