NVIDIA GPU Family / Chip / SM / CUDA 速查表
覆盖 G80 (2006) → Blackwell Ultra (2025) 全部主流 NVIDIA GPU 架构。所有信息来源于公开文档(NVIDIA CUDA Programming Guide / CUDA Toolkit Release Notes / Blackwell Compatibility Guide / developer.nvidia.com/cuda-gpus / Wikipedia 各架构页)。最近更新:2026-06。如发现错漏请告知。
列说明:
Family = 微架构;
Chip = 芯片代号(GA100、GB202 等);
SM (CC) = 编译时
nvcc -arch=sm_XX 用的 compute capability;
代表产品 = 数据中心 / 消费 / 嵌入式 主要 SKU;
最低 CUDA = 第一个原生支持该 sm 的 CUDA Toolkit 版本;
状态 = 当前(CUDA 13.x)对该架构的编译支持。
主表 — 按 Family 分组,每芯片一行
| Family | Chip | SM (CC) | 代表产品 | 最低 CUDA | 状态 |
|---|---|---|---|---|---|
| Tesla 2006-2009 |
G80 | sm_10 |
8800 GTX/Ultra/GTS, Quadro FX 5600, Tesla C870 | 1.0 | CUDA 7.0 移除 |
G84 | sm_11 | 8600 GTS/GT | 1.1 | CUDA 7.0 移除 | |
G86 | sm_11 | 8500/8400 GT | 1.1 | CUDA 7.0 移除 | |
G92 | sm_11 | 8800 GT/GTS-512, 9800 GTX, Tesla M1060 | 1.1 | CUDA 7.0 移除 | |
G94 | sm_11 | 9600 GT/GSO | 1.1 | CUDA 7.0 移除 | |
G96 | sm_11 | 9500 GT | 1.1 | CUDA 7.0 移除 | |
G98 | sm_11 | 8400 GS rev.2 | 1.1 | CUDA 7.0 移除 | |
GT200 | sm_13 | GTX 280/260, Tesla C1060/S1070 | 2.0 | CUDA 7.0 移除 | |
GT200b | sm_13 | GTX 285/295/275 | 2.0 | CUDA 7.0 移除 | |
GT215 | sm_12 | GeForce GT 240 | 2.3 | CUDA 7.0 移除 | |
GT216 | sm_12 | GeForce GT 220 | 2.3 | CUDA 7.0 移除 | |
GT218 | sm_12 | GeForce 210 | 2.3 | CUDA 7.0 移除 | |
| Fermi 2010-2011 |
GF100 | sm_20 |
GTX 480/470, Tesla M2050/M2070/M2090, Quadro 4000/5000/6000 | 3.0 | CUDA 9.0 移除 |
GF110 | sm_20 | GTX 580/570 | 3.0 | CUDA 9.0 移除 | |
GF104 | sm_21 | GTX 460 | 3.2 | CUDA 9.0 移除 | |
GF106 | sm_21 | GTS 450 | 3.2 | CUDA 9.0 移除 | |
GF108 | sm_21 | GT 430/440/630 | 3.2 | CUDA 9.0 移除 | |
GF114 | sm_21 | GTX 560 Ti | 3.2 | CUDA 9.0 移除 | |
GF116 | sm_21 | GTX 550 Ti | 3.2 | CUDA 9.0 移除 | |
GF117 | sm_21 | GeForce 600M(移动) | 3.2 | CUDA 9.0 移除 | |
GF119 | sm_21 | GT 520/610 | 3.2 | CUDA 9.0 移除 | |
| Kepler 2012-2014 |
GK104 | sm_30 |
GTX 680/670/660 Ti, Tesla K10, Tesla K8 | 4.2 | CUDA 11 deprecated |
GK106 | sm_30 | GTX 660/650 Ti | 4.2 | CUDA 11 deprecated | |
GK107 | sm_30 | GTX 650/640 | 4.2 | CUDA 11 deprecated | |
GK110 | sm_35 | GTX 780/Titan, Tesla K20/K20X/K40 | 5.0 | CUDA 12.0 移除 | |
GK110B | sm_35 | GTX 780 Ti, Titan Black | 5.0 | CUDA 12.0 移除 | |
GK208 | sm_35 | GT 730/710 | 5.0 | CUDA 12.0 移除 | |
GK210 | sm_37 | Tesla K80(双 GPU 板) | 6.5 | CUDA 12.0 移除 | |
GK20A | sm_32 | Tegra K1 / Jetson TK1 | 6.0 | CUDA 12.0 移除 | |
| Maxwell 2014-2015 |
GM107 | sm_50 |
GTX 750/750 Ti, Tesla M4 | 6.0 | CUDA 13.0 移除 |
GM108 | sm_50 | Quadro K-series 移动 | 6.0 | CUDA 13.0 移除 | |
GM200 | sm_52 | GTX 980 Ti, Titan X (Maxwell), Tesla M40 | 6.0 | CUDA 13.0 移除 | |
GM204 | sm_52 | GTX 980/970, Tesla M60 | 6.0 | CUDA 13.0 移除 | |
GM206 | sm_52 | GTX 960/950 | 6.0 | CUDA 13.0 移除 | |
GM20B | sm_53 | Tegra X1, Jetson TX1, Nintendo Switch | 7.0 | CUDA 13.0 移除 | |
| Pascal 2016-2017 |
GP100 | sm_60 |
Tesla P100 (PCIe/SXM2), Quadro GP100 | 8.0 | CUDA 13.0 移除 |
GP102 | sm_61 | GTX 1080 Ti, Titan X/Xp, Tesla P40 | 8.0 | CUDA 13.0 移除 | |
GP104 | sm_61 | GTX 1080/1070, Tesla P4 | 8.0 | CUDA 13.0 移除 | |
GP106 | sm_61 | GTX 1060 | 8.0 | CUDA 13.0 移除 | |
GP107 | sm_61 | GTX 1050 Ti/1050 | 8.0 | CUDA 13.0 移除 | |
GP108 | sm_61 | GT 1030 | 8.0 | CUDA 13.0 移除 | |
GP10B | sm_62 | Tegra X2, Jetson TX2 | 8.0 | CUDA 13.0 移除 | |
| Volta 2017-2019 |
GV100 | sm_70 |
Tesla V100 (PCIe/SXM2), Titan V, Quadro GV100 | 9.0 | CUDA 13.0 移除 |
GV10B | sm_72 | Xavier, Jetson AGX Xavier | 10.0 | CUDA 13.0 移除 | |
GV11B | sm_72 | Drive AGX Xavier | 10.0 | CUDA 13.0 移除 | |
| Turing 2018-2019 |
TU102 | sm_75 |
RTX 2080 Ti, Titan RTX, Quadro RTX 6000/8000 | 10.0 | 支持 |
TU104 | sm_75 | RTX 2080/2070 Super, Tesla T4, Quadro RTX 5000 | 10.0 | 支持 | |
TU106 | sm_75 | RTX 2070/2060/2060 Super | 10.0 | 支持 | |
TU116 | sm_75 | GTX 1660 Ti/1660 Super(无 RT/Tensor) | 10.0 | 支持 | |
TU117 | sm_75 | GTX 1650 | 10.0 | 支持 | |
| Ampere 2020-2021 |
GA100 | sm_80 |
A100 (PCIe/SXM4), A30 | 11.0 | 支持 |
GA102 | sm_86 | RTX 3090 Ti/3090/3080, RTX A6000/A5000, A40 | 11.1 | 支持 | |
GA103 | sm_86 | RTX 3080 Ti Mobile | 11.1 | 支持 | |
GA104 | sm_86 | RTX 3070 Ti/3070/3060 Ti, RTX A4000, A10 | 11.1 | 支持 | |
GA106 | sm_86 | RTX 3060, A16, A2 | 11.1 | 支持 | |
GA107 | sm_86 | RTX 3050 | 11.1 | 支持 | |
GA10B | sm_87 | Orin, Jetson AGX Orin / Orin NX / Orin Nano | 11.5 | 支持 | |
| Ada Lovelace 2022-2023 |
AD102 | sm_89 |
RTX 4090, RTX 6000 Ada | 11.8 | 支持 |
AD103 | sm_89 | RTX 4080 Super, RTX 5000 Ada, L40, L40S | 11.8 | 支持 | |
AD104 | sm_89 | RTX 4070 Ti/4070, RTX 4500 Ada, L4 | 11.8 | 支持 | |
AD106 | sm_89 | RTX 4060 Ti, RTX 4000 Ada | 11.8 | 支持 | |
AD107 | sm_89 | RTX 4060, RTX 2000 Ada | 11.8 | 支持 | |
| Hopper 2022-2024 |
GH100 | sm_90 / sm_90a |
H100 (PCIe/SXM5), H800 | 11.8 / 12.0 | 支持 |
GH200 | sm_90 / sm_90a | H200, GH200 Grace Hopper Superchip | 12.0 | 支持 | |
| Blackwell (数据中心) 2024-2025 |
GB100 | sm_100 / sm_100a |
B100, B200 | 12.8 | 最新 |
GB200 | sm_100 / sm_100a | GB200 Grace Blackwell Superchip, GB200 NVL72 | 12.8 | 最新 | |
| Blackwell Ultra 2025 H2 |
GB300 | sm_103 / sm_103a |
B300, GB300 NVL72, HGX B300 | 12.9 / 13.0 | 最新 |
| Blackwell (消费 / 工作站) 2025 |
GB202 | sm_120 / sm_120a |
RTX 5090, RTX PRO 6000 Blackwell | 12.8 | 最新 |
GB203 | sm_120 | RTX 5080, RTX 5070 Ti, RTX PRO 5000 | 12.8 | 最新 | |
GB205 | sm_120 | RTX 5070, RTX PRO 4500 | 12.8 | 最新 | |
GB206 | sm_120 | RTX 5060 Ti, RTX PRO 4000 | 12.8 | 最新 | |
GB207 | sm_120 | RTX 5060/5050, RTX PRO 2000 | 12.8 | 最新 | |
| Blackwell (嵌入式 / Spark) 2025 |
GB10 | sm_121 |
DGX Spark(Grace Blackwell Superchip,1× Blackwell GPU + 20-core ARM + 128 GB LPDDR5X) | 13.0 | 最新 |
| Thor SoC (代号未官方公布,可能为 GB10B) |
sm_121 |
Jetson Thor / DRIVE Thor(机器人 / 自动驾驶) | 13.0 | 最新 | |
| Rubin 2026+ |
R100代号未确认 |
TBD | GTC 2025 announced;Vera Rubin Superchip / Rubin Ultra (2027) | TBD | 未发售 |
说明:Rubin 至本文更新时仅 GTC 2025 公开,具体 SM 号、最低 CUDA 等未释出。表中 "代号未确认" 即此意。
辅表 1 — 各 Compute Capability 最低支持的 CUDA Toolkit
写 nvcc -arch=sm_XX 时最常查的就是这张表。
| CC | 架构 | 第一个支持的 CUDA | 状态 |
|---|---|---|---|
sm_10/11/12/13 | Tesla | 1.0 / 2.0 / 2.3 | CUDA 7.0 移除 |
sm_20/21 | Fermi | 3.0 / 3.2 | CUDA 9.0 移除 |
sm_30 | Kepler 第一代 | 4.2 | CUDA 11 deprecated |
sm_32 | Kepler (Tegra K1) | 6.0 | CUDA 12.0 移除 |
sm_35 | Kepler GK110 | 5.0 | CUDA 12.0 移除 |
sm_37 | Kepler GK210 (K80) | 6.5 | CUDA 12.0 移除 |
sm_50/52 | Maxwell | 6.0 | CUDA 13.0 移除 |
sm_53 | Maxwell GM20B (TX1) | 7.0 | CUDA 13.0 移除 |
sm_60 | Pascal GP100 | 8.0 | CUDA 13.0 移除 |
sm_61 | Pascal GP10x 消费 | 8.0 | CUDA 13.0 移除 |
sm_62 | Pascal GP10B (TX2) | 8.0 | CUDA 13.0 移除 |
sm_70 | Volta GV100 | 9.0 | CUDA 13.0 移除 |
sm_72 | Volta GV10B (Xavier) | 10.0 | CUDA 13.0 移除 |
sm_75 | Turing | 10.0 | 支持 |
sm_80 | Ampere GA100 | 11.0 | 支持 |
sm_86 | Ampere GA10x | 11.1 | 支持 |
sm_87 | Ampere GA10B (Orin) | 11.5 | 支持 |
sm_89 | Ada Lovelace | 11.8 | 支持 |
sm_90 / sm_90a | Hopper | 11.8 / 12.0 | 支持 |
sm_100 / sm_100a | Blackwell DC (GB100/GB200) | 12.8 | 最新 |
sm_103 / sm_103a | Blackwell Ultra (GB300) | 12.9 / 13.0 | 最新 |
sm_120 / sm_120a | Blackwell 消费/工作站 (GB20x) | 12.8 | 最新 |
sm_121 | Blackwell 嵌入式 (GB10/Jetson Thor) | 13.0 | 最新 |
辅表 2 — Tensor Core 代际
| 代 | 架构 | 首发产品 | CC | 新增数据类型 |
|---|---|---|---|---|
| 1st | Volta | V100 (2017) | sm_70 | FP16 mixed (FP16×FP16 → FP32 累加) |
| 2nd | Turing | T4, RTX 20 系 (2018) | sm_75 | + INT8 / INT4 / INT1 |
| 3rd | Ampere | A100 (2020) | sm_80/86 | + TF32, BF16, FP64 Tensor, 2:4 结构化稀疏 |
| 4th (DC) | Hopper | H100 (2022) | sm_90 | + FP8 (E4M3, E5M2);1st-gen Transformer Engine;TMA;Thread Block Cluster;DPX |
| 4th (图形) | Ada Lovelace | RTX 4090 (2022) | sm_89 | FP8 引入消费 / 工作站 |
| 5th | Blackwell / Ultra | B200 (2024) / B300 (2025) / RTX 5090 (2025) | sm_100 / sm_103 / sm_120 | + MXFP6, MXFP4(microscaling 子 8-bit);2nd-gen Transformer Engine |
常见陷阱
①
sm_XX vs sm_XXa:a 后缀启用架构专属 PTX(Hopper 的 wgmma / TMA;Blackwell 的 tcgen05 MMA)。不向前兼容 —— sm_90a 编译的 PTX 不能在 Blackwell 上跑。
② 数据中心 Blackwell ≠ 消费 Blackwell:B100/B200(GB100/GB200)是
sm_100;RTX 50 / RTX PRO(GB202-207)是 sm_120。二进制不兼容,编译时必须分别 target。
③ GB300 (Blackwell Ultra) 是独立 SM 号:
sm_103,不是 sm_100 的延伸。HGX B300 / GB300 NVL72 部署需 CUDA 12.9+。
④ CUDA 13.0 大清洗:Maxwell(sm_50/52/53) / Pascal(sm_60/61/62) / Volta(sm_70/72)在 CUDA 13.0 移除 offline 编译(
nvcc -arch=sm_XX 不再接受)。部署到老硬件请锁 CUDA 12.x。
⑤
compute_XX vs sm_XX:compute_XX = 虚拟架构(PTX target);sm_XX = 物理架构(SASS target)。常见做法:-gencode arch=compute_90,code=sm_90 同时编 PTX(可向前 forward-compile)+ SASS(运行时无需 JIT)。
⑥ Tegra/Jetson 体系单独维护:嵌入式 SM 号(
sm_32/53/62/72/87/121)通常落后于桌面同代 1 个 minor 版本,但常带专属功能(NVDLA、ISP 等)。Jetson Thor (Blackwell 嵌入式) 是 sm_121 而非 sm_120。
参考资料
NVIDIA 官方文档
- CUDA C++ Programming Guide — Compute Capabilities appendix — 各 sm 的核心 / 内存 / 寄存器规格
- CUDA Toolkit Release Notes — 每版 CUDA 支持/移除的 sm 列表
- Blackwell Compatibility Guide — sm_100 / sm_100a / sm_120 的区别
- Hopper Compatibility Guide — sm_90 / sm_90a
- Ada Compatibility Guide — sm_89
- Ampere Compatibility Guide — sm_80/86
- NVIDIA CUDA GPUs 官方对照表 — 包含全部消费 / 工作站 / 数据中心 SKU
NVIDIA Developer Blog 架构深度文
- CUDA Toolkit 12.8 Delivers NVIDIA Blackwell Support
- Inside NVIDIA Blackwell Ultra: The Chip Powering the AI Factory Era
- NVIDIA Hopper Architecture In-Depth
- NVIDIA Ampere Architecture In-Depth
- NVIDIA Turing Architecture In-Depth
NVIDIA White Papers (PDF)
- NVIDIA Blackwell Architecture Technical Brief
- NVIDIA Tensor Core GPU Datasheets — H100、A100、L40S 等
- H100 / A100 / V100 Architecture White Papers(在 nvidia.com 各产品页可下载)
NVIDIA 产品页(规格 / SKU 详情)
- H100 · H200 · HGX B200 / B300
- GB200 NVL72 · GB300 NVL72
- GeForce RTX 50 系列 · RTX PRO Workstation
- Jetson Modules(Orin / Thor)