网站地图官方微信:
网站首页 包装防伪 折射仪 圆规 语音室成套设备 眼镜布 文件柜

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | 如何评价钟南山院士? |

    作为一名初一学生,我虽然不太了解他这个人,但我可以通过一些事...

    查看详情>>
  • | 为什么人到中年,很少有身材苗条的? |

  • | 为什么不用rust重写Nginx? |

  • | 纯理科高中生想接触科技圈子,学软件硬件编程,有空自己造点东西。问问各位大佬从哪里开始了解,入门,动手? |

  • | 美国下场轰炸伊朗,这次我国为什么要这么直白的谴责美国? |

  • | 如何评价张靓颖刘宇宁《九万字》? |

  • | 如何看待2025江苏国补在6月1日突然暂停下线? |

  • | 目前react的生态系统是什么情况,有没有比较公认的成熟的开发技术栈? |

  • | 买到烂尾楼到底该有多绝望? |

  • | 你用n8n/dify搭建了哪些实用的Agent工作流? |

  • | 现在写 J***aScript 的是不是已经没人在用 class 这个关键字了? |

  • 现在手机的内存,动不动也12G,16G了,有时候还杀后台。 ...

    2025-06-26
  • 我女朋友就是iOS开发,硕士,sci一区一篇,面试手撕算法题...

    2025-06-26
  • 不是自拍,他拍算吗。 23年的夏天和好朋友一起去海边,玩了...

    2025-06-26
  • 社会上对于顶级名校的“专家教授”亲赴“野鸡场景”讲课是存在刚...

    2025-06-26

关注我们

添加微信好友,关注最新动态