网站地图官方微信:
网站首页 新杭镇 陵头镇 龙背乡 按板镇 古登乡 鸳鸯镇

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | 黄金,今年会达到怎样的高度? |

    谢邀,黄金今年会要人命,黄金已经高位震荡2个月了,这两天虽然...

    查看详情>>
  • | 你为什么放弃了wsl? |

  • | 如何看待特朗普第三次宣布延长出售 Tiktok 的时限?美方此举背后有哪些考量? |

  • | 在生活中,你对净水器有什么痛点?你期待的净水产品是什么样子? |

  • | 鱼缸上的藻类怎么去掉? |

  • | 以色列是如何从三天前的不可一世要灭了伊朗到今天的哭哭啼啼要“为生存而战”的? |

  • | 参加知乎「第十一届新知青年大会」是种什么样的体验? |

  • | 网传厦门某国企研发部门要求每日考察后端 400 行,前端 1000 行代码量,如属实,这个考核合理吗? |

  • | SpaceX 星舰 36 号火箭静态点火测试爆炸,爆炸的原因是什么?会对星舰发展产生什么影响? |

  • | 为什么 php 可以做到 7 毫秒以内响应,而 .net 做不到? |

  • | 苹果为什么要给每代MacOS起个名字,真以为人们记得住分得清吗? |

  • Nas 里的,基本都是docker部署的 下载 qbitto...

    2025-06-21
  • 58同城的颓势,甚至早在十年前,就已经注定了。 追溯历史,...

    2025-06-21
  • 我瞎编个故事哈~ 公司有个老头儿,他给刚入职的同学做培训,他...

    2025-06-21
  • 看到这题的时候我就知道某些人会拿Mathura雕像说事。 利...

    2025-06-21

关注我们

添加微信好友,关注最新动态