网站地图官方微信:
网站首页 白山镇 澧东乡 芒场镇 大足区 兰田镇 鲁甸县

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | 个子高是种怎样的体验? |

    泻药,本人女,186/62 小学毕业就173了,后面陆陆续续...

    查看详情>>
  • | 有哪些新生代没见过或者无法理解的 Windows XP 7 时代的事情? |

  • | 程序员男朋友都是怎样的? |

  • | 为什么 Windows 没有比较成熟的第三方桌面环境(explorer.exe)? |

  • | 不管黑客用了多少跳板,最终是不是可以通过网络运营商找出真实 IP? |

  • | 为什么 CRT 画质这么好也被淘汰,液晶反而发展的很好? |

  • | 为什么棒球在我国毫无水花? |

  • | 现在手里有一万闲钱,买什么币好? |

  • | 怎么隔离dify和RAGflow ? |

  • | cloudflare的1.1.1.1和warp有什么区别? |

  • | 豆包推出 AI 编程,在「编辑模式」下可以直接前端改图和文字,体验如何?对行业会带来怎样的影响? |

  • Tiktok后端开发,偏架构设计。 目前我了解到的,只有在...

    2025-06-25
  • 炸裂!70 岁盖茨与 56 岁 Linus 首次同框,一张照...

    2025-06-25
  • 前端技术好不好不知道。 但是在知乎上声音是真的大。 那为...

    2025-06-26
  • token放在redis里只是一种很正常的方案。 在有多个后...

    2025-06-26

关注我们

添加微信好友,关注最新动态