假设一个 SM 有 40K 的 shared memory ,然后能运行 4 个 block ,那么
是不是说每个 block 最多用 10K ?
是不是然后这些 block 用的 shared memory 都是对彼此不可见的?
1
leimao 2022-10-31 23:01:53 +08:00 via iPhone
|
2
leimao 2022-10-31 23:06:15 +08:00 via iPhone
另外 SM 的分配不是由你直接决定的,得看系统资源
https://leimao.github.io/blog/CUDA-Occupancy-Calculation/ |