HSTU Thread-Map Presets — Stream / Thread / Lookahead 对照

14 个 HSTU task 在 6 个 thread_map preset 下的线程归属。stream 和 lookahead 是固定的,只有 thread 在变。Y 轴按 stream 分行;每个 task 框上方的小药丸是该 task 在当前 preset 下被分配的线程;右上角红字是 @lookahead

Stream 颜色 default memcpy data_dist prefetch  |  线程颜色 io compute data_dist prefetch tNN(per-task)
lookahead: la=2 → 比 forward 早 2 个 progress;la=0 → 同 progress;越大越提前。

源数据来自 examples/commons/pipeline/hstu_pipeline/pipeline.py(HSTU_DEFAULT_THREAD_MAP / HSTU_THREAD_MAP_PRESETS / la 计算式)。