← 返回速查表合集
参考: Nsight Systems Exporter · CUPTI Activity API · CUpti_Activity 结构

Nsight Systems / CUPTI 表速查表

nsys export --type sqlite 后的核心表
※ 列基于 nsys 2024.x — 2026.x;老版本字段集略小
GPU实际在 GPU 上发生,时间戳为 GPU 时钟(KERNEL / MEMCPY / MEMSET / GRAPH_TRACE / UVM)
CPUhost 线程上的事件,时间戳为 CPU 时钟(RUNTIME / DRIVER / OSRT / NVTX / SAMPLING)
MIXED同时含 host 与 device 语义(MEMORY 生命周期、SYNC 等待)
META维度 / 元数据表,无时间序列(StringIds / TARGET_INFO_*)

核心表的级联关系(全部 24 张表,全名)

[CPU 事实表]                                                                  [GPU 事实表]
┌─────────────────────────────────────────┐                                ┌─────────────────────────────────────────┐
│ CUPTI_ACTIVITY_KIND_RUNTIME             │                                │ CUPTI_ACTIVITY_KIND_KERNEL              │
│ CUPTI_ACTIVITY_KIND_DRIVER              │                                │ CUPTI_ACTIVITY_KIND_MEMCPY              │
│ CUPTI_ACTIVITY_KIND_CUDA_EVENT          │── correlationId ──────────────►│ CUPTI_ACTIVITY_KIND_MEMSET              │
│ CUPTI_ACTIVITY_KIND_SYNCHRONIZATION     │   (host launch ↔ GPU 执行)      │ CUPTI_ACTIVITY_KIND_GRAPH_TRACE         │
│ NVTX_EVENTS                             │                                │ CUPTI_ACTIVITY_KIND_UNIFIED_MEMORY_     │
│ OSRT_API                                │                                │   COUNTER                               │
│ COMPOSITE_EVENTS                        │── callchainId ────►            │ CUDA_GPU_MEMORY_USAGE_EVENTS            │
│ PROFILER_OVERHEAD                       │   SAMPLING_CALLCHAINS(id)      └─────────────────────────────────────────┘
└─────────────────────────────────────────┘                                            │  graphId / graphNodeId
              │                  │                                                      │  (CUDA Graph 子节点
              │ globalTid        │ nameId / textId / domainId /                         │   与 GRAPH_TRACE 共享)
              │                  │ symbol / module / shortName /                        │
              ▼                  │ demangledName / mangledName /                        ▼
[META 维度表]            │ name / source / value(所有 *Id 字段)         自连接
ThreadNames(                     ▼
  globalTid, nameId,    StringIds(id, value)  ◄────────────────────────── 几乎所有事实表都通过 *Id 字段引用
  priority)                       ▲
       ▲                          │
       │ globalTid                │ nameId(线程名)
       └──────────────────────────┘

[MIXED 生命周期表]                                                       [META 主题维度]
┌────────────────────────────────────────────┐                          TARGET_INFO_PROCESS(globalPid, pid, nameId, command)
│ CUPTI_ACTIVITY_KIND_MEMORY                 │── correlationId          ▲   ▲   ▲   ▲   ▲   ▲   ▲   ▲   ▲   ▲   ▲   ▲   ▲   ▲
│ CUPTI_ACTIVITY_KIND_MEMORY2 (新版拆分)     │   (cudaMalloc/Free 的    │ globalPid 来自所有 GPU 事实表 + NVTX_EVENTS
│ CUPTI_ACTIVITY_KIND_MEMORY_POOL            │   RUNTIME 行)            │
└────────────────────────────────────────────┘                          TARGET_INFO_GPU(id, name, computeCapMajor/Minor, smCount, ...)
        │                                                                ▲   ▲   ▲   ▲   ▲   ▲   ▲   ▲
        │ deviceId(在哪个 GPU 分配)                                     │ deviceId / srcDeviceId / dstDeviceId / srcId / dstId / gpuId
        └─────────────────────────────────────────────────────────────────┘ 来自 KERNEL, MEMCPY, MEMSET, SYNCHRONIZATION, GRAPH_TRACE,
                                                                            UVM_COUNTER, GPU_MEMORY_USAGE, MEMORY, MEMORY_POOL,
                                                                            TARGET_INFO_NVLINK_INFO, TARGET_INFO_PCIE_INFO

[META 拓扑]
TARGET_INFO_NVLINK_INFO(localGpuId, peerGpuId, bandwidth, physicalNvLinkCount, isActive)
       │                                       │
       └── localGpuId / peerGpuId ─────────────┴──► TARGET_INFO_GPU(id)

TARGET_INFO_PCIE_INFO(gpuId, pcieGen, pcieWidth, bandwidth) ── gpuId ──► TARGET_INFO_GPU(id)

[META 全局常量]
TARGET_INFO_SESSION_START_TIME(utcEpochNs) — session 0 时刻对应的 UTC 纳秒;
   与所有事实表无 FK,仅作为时间偏移→绝对时间的基准

约定:箭头方向 事实表 ──FK 列──► 维度表。两条隐式规则在卡片里不再重复列出 —— 所有 host 事实表的 globalTid → ThreadNames所有事实表的 globalPid → TARGET_INFO_PROCESS

共 0 张表 · 0 个字段

说明: