网站地图官方微信:
网站首页 包装用纸 包装项目合作 圆珠笔 眼镜片 学习文具 修正带

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | 为什么这么久了还是没有主流软件开发鸿蒙版? |

    其实就是钱的问题。 有些华为粉丝经常发布如下言论: “国企...

    查看详情>>
  • | 现在已经有5K、6K、8K分辨率显示器,那么8K之后是什么? |

  • | 如何评价钟南山院士? |

  • | 为什么 mac mini 的 m4 版本价格这么低呢? |

  • | 如何看待《海贼王》1152话尾田给出的香克斯断臂的解释? |

  • | 大一计算机新生怎么合理利用github? |

  • | 在办公室用机械键盘是什么心里? |

  • | 公司老板不想续费3w一年的云服务器,合理吗? |

  • | 为什么国内没有一个发布需求的***或网站呢? |

  • | 如果让你重新开始学计算机,你的学习路线会怎么选择? |

  • | 如何评价Cursor? |

  • 上周打電話問電信,可否將光貓改橋接模式。 電信客服說改了橋接...

    2025-06-25
  • 前段时间出门旅行了一周,回来后我老婆反映刷抖音网络卡,问我怎...

    2025-06-25
  • 吉利熊猫mini耐力熊,套国补新车最低2.4万左右。 它续...

    2025-06-25
  • 最近喜欢上了养鱼,从网上买了几条小鱼,大小都差不多的,养着养...

    2025-06-25

关注我们

添加微信好友,关注最新动态