NVIDIA GPU Family / Chip / SM / CUDA 速查表

覆盖 G80 (2006) → Blackwell Ultra (2025) 全部主流 NVIDIA GPU 架构。所有信息来源于公开文档(NVIDIA CUDA Programming Guide / CUDA Toolkit Release Notes / Blackwell Compatibility Guide / developer.nvidia.com/cuda-gpus / Wikipedia 各架构页)。最近更新:2026-06。如发现错漏请告知。

列说明: Family = 微架构; Chip = 芯片代号(GA100、GB202 等); SM (CC) = 编译时 nvcc -arch=sm_XX 用的 compute capability; 代表产品 = 数据中心 / 消费 / 嵌入式 主要 SKU; 最低 CUDA = 第一个原生支持该 sm 的 CUDA Toolkit 版本; 状态 = 当前(CUDA 13.x)对该架构的编译支持。

主表 — 按 Family 分组,每芯片一行

Family Chip SM (CC) 代表产品 最低 CUDA 状态
Tesla
2006-2009
G80sm_10 8800 GTX/Ultra/GTS, Quadro FX 5600, Tesla C870 1.0CUDA 7.0 移除
G84sm_118600 GTS/GT1.1CUDA 7.0 移除
G86sm_118500/8400 GT1.1CUDA 7.0 移除
G92sm_118800 GT/GTS-512, 9800 GTX, Tesla M10601.1CUDA 7.0 移除
G94sm_119600 GT/GSO1.1CUDA 7.0 移除
G96sm_119500 GT1.1CUDA 7.0 移除
G98sm_118400 GS rev.21.1CUDA 7.0 移除
GT200sm_13GTX 280/260, Tesla C1060/S10702.0CUDA 7.0 移除
GT200bsm_13GTX 285/295/2752.0CUDA 7.0 移除
GT215sm_12GeForce GT 2402.3CUDA 7.0 移除
GT216sm_12GeForce GT 2202.3CUDA 7.0 移除
GT218sm_12GeForce 2102.3CUDA 7.0 移除
Fermi
2010-2011
GF100sm_20 GTX 480/470, Tesla M2050/M2070/M2090, Quadro 4000/5000/6000 3.0CUDA 9.0 移除
GF110sm_20GTX 580/5703.0CUDA 9.0 移除
GF104sm_21GTX 4603.2CUDA 9.0 移除
GF106sm_21GTS 4503.2CUDA 9.0 移除
GF108sm_21GT 430/440/6303.2CUDA 9.0 移除
GF114sm_21GTX 560 Ti3.2CUDA 9.0 移除
GF116sm_21GTX 550 Ti3.2CUDA 9.0 移除
GF117sm_21GeForce 600M(移动)3.2CUDA 9.0 移除
GF119sm_21GT 520/6103.2CUDA 9.0 移除
Kepler
2012-2014
GK104sm_30 GTX 680/670/660 Ti, Tesla K10, Tesla K8 4.2CUDA 11 deprecated
GK106sm_30GTX 660/650 Ti4.2CUDA 11 deprecated
GK107sm_30GTX 650/6404.2CUDA 11 deprecated
GK110sm_35GTX 780/Titan, Tesla K20/K20X/K405.0CUDA 12.0 移除
GK110Bsm_35GTX 780 Ti, Titan Black5.0CUDA 12.0 移除
GK208sm_35GT 730/7105.0CUDA 12.0 移除
GK210sm_37Tesla K80(双 GPU 板)6.5CUDA 12.0 移除
GK20Asm_32Tegra K1 / Jetson TK16.0CUDA 12.0 移除
Maxwell
2014-2015
GM107sm_50 GTX 750/750 Ti, Tesla M4 6.0CUDA 13.0 移除
GM108sm_50Quadro K-series 移动6.0CUDA 13.0 移除
GM200sm_52GTX 980 Ti, Titan X (Maxwell), Tesla M406.0CUDA 13.0 移除
GM204sm_52GTX 980/970, Tesla M606.0CUDA 13.0 移除
GM206sm_52GTX 960/9506.0CUDA 13.0 移除
GM20Bsm_53Tegra X1, Jetson TX1, Nintendo Switch7.0CUDA 13.0 移除
Pascal
2016-2017
GP100sm_60 Tesla P100 (PCIe/SXM2), Quadro GP100 8.0CUDA 13.0 移除
GP102sm_61GTX 1080 Ti, Titan X/Xp, Tesla P408.0CUDA 13.0 移除
GP104sm_61GTX 1080/1070, Tesla P48.0CUDA 13.0 移除
GP106sm_61GTX 10608.0CUDA 13.0 移除
GP107sm_61GTX 1050 Ti/10508.0CUDA 13.0 移除
GP108sm_61GT 10308.0CUDA 13.0 移除
GP10Bsm_62Tegra X2, Jetson TX28.0CUDA 13.0 移除
Volta
2017-2019
GV100sm_70 Tesla V100 (PCIe/SXM2), Titan V, Quadro GV100 9.0CUDA 13.0 移除
GV10Bsm_72Xavier, Jetson AGX Xavier10.0CUDA 13.0 移除
GV11Bsm_72Drive AGX Xavier10.0CUDA 13.0 移除
Turing
2018-2019
TU102sm_75 RTX 2080 Ti, Titan RTX, Quadro RTX 6000/8000 10.0支持
TU104sm_75RTX 2080/2070 Super, Tesla T4, Quadro RTX 500010.0支持
TU106sm_75RTX 2070/2060/2060 Super10.0支持
TU116sm_75GTX 1660 Ti/1660 Super(无 RT/Tensor)10.0支持
TU117sm_75GTX 165010.0支持
Ampere
2020-2021
GA100sm_80 A100 (PCIe/SXM4), A30 11.0支持
GA102sm_86RTX 3090 Ti/3090/3080, RTX A6000/A5000, A4011.1支持
GA103sm_86RTX 3080 Ti Mobile11.1支持
GA104sm_86RTX 3070 Ti/3070/3060 Ti, RTX A4000, A1011.1支持
GA106sm_86RTX 3060, A16, A211.1支持
GA107sm_86RTX 305011.1支持
GA10Bsm_87Orin, Jetson AGX Orin / Orin NX / Orin Nano11.5支持
Ada Lovelace
2022-2023
AD102sm_89 RTX 4090, RTX 6000 Ada 11.8支持
AD103sm_89RTX 4080 Super, RTX 5000 Ada, L40, L40S11.8支持
AD104sm_89RTX 4070 Ti/4070, RTX 4500 Ada, L411.8支持
AD106sm_89RTX 4060 Ti, RTX 4000 Ada11.8支持
AD107sm_89RTX 4060, RTX 2000 Ada11.8支持
Hopper
2022-2024
GH100sm_90 / sm_90a H100 (PCIe/SXM5), H800 11.8 / 12.0支持
GH200sm_90 / sm_90aH200, GH200 Grace Hopper Superchip12.0支持
Blackwell
(数据中心)
2024-2025
GB100sm_100 / sm_100a B100, B200 12.8最新
GB200sm_100 / sm_100aGB200 Grace Blackwell Superchip, GB200 NVL7212.8最新
Blackwell Ultra
2025 H2
GB300sm_103 / sm_103a B300, GB300 NVL72, HGX B300 12.9 / 13.0最新
Blackwell
(消费 / 工作站)
2025
GB202sm_120 / sm_120a RTX 5090, RTX PRO 6000 Blackwell 12.8最新
GB203sm_120RTX 5080, RTX 5070 Ti, RTX PRO 500012.8最新
GB205sm_120RTX 5070, RTX PRO 450012.8最新
GB206sm_120RTX 5060 Ti, RTX PRO 400012.8最新
GB207sm_120RTX 5060/5050, RTX PRO 200012.8最新
Blackwell
(嵌入式 / Spark)
2025
GB10sm_121 DGX Spark(Grace Blackwell Superchip,1× Blackwell GPU + 20-core ARM + 128 GB LPDDR5X) 13.0最新
Thor SoC
(代号未官方公布,可能为 GB10B)
sm_121 Jetson Thor / DRIVE Thor(机器人 / 自动驾驶) 13.0最新
Rubin
2026+
R100
代号未确认
TBD GTC 2025 announced;Vera Rubin Superchip / Rubin Ultra (2027) TBD未发售

说明:Rubin 至本文更新时仅 GTC 2025 公开,具体 SM 号、最低 CUDA 等未释出。表中 "代号未确认" 即此意。


辅表 1 — 各 Compute Capability 最低支持的 CUDA Toolkit

nvcc -arch=sm_XX 时最常查的就是这张表。

CC架构第一个支持的 CUDA状态
sm_10/11/12/13Tesla1.0 / 2.0 / 2.3CUDA 7.0 移除
sm_20/21Fermi3.0 / 3.2CUDA 9.0 移除
sm_30Kepler 第一代4.2CUDA 11 deprecated
sm_32Kepler (Tegra K1)6.0CUDA 12.0 移除
sm_35Kepler GK1105.0CUDA 12.0 移除
sm_37Kepler GK210 (K80)6.5CUDA 12.0 移除
sm_50/52Maxwell6.0CUDA 13.0 移除
sm_53Maxwell GM20B (TX1)7.0CUDA 13.0 移除
sm_60Pascal GP1008.0CUDA 13.0 移除
sm_61Pascal GP10x 消费8.0CUDA 13.0 移除
sm_62Pascal GP10B (TX2)8.0CUDA 13.0 移除
sm_70Volta GV1009.0CUDA 13.0 移除
sm_72Volta GV10B (Xavier)10.0CUDA 13.0 移除
sm_75Turing10.0支持
sm_80Ampere GA10011.0支持
sm_86Ampere GA10x11.1支持
sm_87Ampere GA10B (Orin)11.5支持
sm_89Ada Lovelace11.8支持
sm_90 / sm_90aHopper11.8 / 12.0支持
sm_100 / sm_100aBlackwell DC (GB100/GB200)12.8最新
sm_103 / sm_103aBlackwell Ultra (GB300)12.9 / 13.0最新
sm_120 / sm_120aBlackwell 消费/工作站 (GB20x)12.8最新
sm_121Blackwell 嵌入式 (GB10/Jetson Thor)13.0最新

辅表 2 — Tensor Core 代际

架构首发产品CC新增数据类型
1stVoltaV100 (2017)sm_70FP16 mixed (FP16×FP16 → FP32 累加)
2ndTuringT4, RTX 20 系 (2018)sm_75+ INT8 / INT4 / INT1
3rdAmpereA100 (2020)sm_80/86+ TF32, BF16, FP64 Tensor, 2:4 结构化稀疏
4th (DC)HopperH100 (2022)sm_90+ FP8 (E4M3, E5M2);1st-gen Transformer Engine;TMA;Thread Block Cluster;DPX
4th (图形)Ada LovelaceRTX 4090 (2022)sm_89FP8 引入消费 / 工作站
5thBlackwell / UltraB200 (2024) / B300 (2025) / RTX 5090 (2025)sm_100 / sm_103 / sm_120+ MXFP6, MXFP4(microscaling 子 8-bit);2nd-gen Transformer Engine

常见陷阱

sm_XX vs sm_XXa:a 后缀启用架构专属 PTX(Hopper 的 wgmma / TMA;Blackwell 的 tcgen05 MMA)。不向前兼容 —— sm_90a 编译的 PTX 不能在 Blackwell 上跑。
② 数据中心 Blackwell ≠ 消费 Blackwell:B100/B200(GB100/GB200)是 sm_100;RTX 50 / RTX PRO(GB202-207)是 sm_120二进制不兼容,编译时必须分别 target。
③ GB300 (Blackwell Ultra) 是独立 SM 号:sm_103,不是 sm_100 的延伸。HGX B300 / GB300 NVL72 部署需 CUDA 12.9+。
④ CUDA 13.0 大清洗:Maxwell(sm_50/52/53) / Pascal(sm_60/61/62) / Volta(sm_70/72)在 CUDA 13.0 移除 offline 编译(nvcc -arch=sm_XX 不再接受)。部署到老硬件请锁 CUDA 12.x。
compute_XX vs sm_XX:compute_XX = 虚拟架构(PTX target);sm_XX = 物理架构(SASS target)。常见做法:-gencode arch=compute_90,code=sm_90 同时编 PTX(可向前 forward-compile)+ SASS(运行时无需 JIT)。
⑥ Tegra/Jetson 体系单独维护:嵌入式 SM 号(sm_32/53/62/72/87/121)通常落后于桌面同代 1 个 minor 版本,但常带专属功能(NVDLA、ISP 等)。Jetson Thor (Blackwell 嵌入式) 是 sm_121 而非 sm_120

参考资料

NVIDIA 官方文档

NVIDIA Developer Blog 架构深度文

NVIDIA White Papers (PDF)

NVIDIA 产品页(规格 / SKU 详情)

Wikipedia 交叉验证(代号 / 消费 SKU)