AI软件下载
有趣网站推荐及实用软件下载

triton.runtime.errors.OutOfResources: out of resource: shared memory, Required: 126978, Hardware limit: 101376. Reducing block sizes or `num_stages` may help

今天在调试python应用MonkeyOCR的时候发生报错,部分错误信息如下:

File “D:\python\MonkeyOCR\py310\lib\site-packages\lmdeploy\pytorch\nn\attention.py”, line 154, in forward return self.impl.forward( File “D:\python\MonkeyOCR\py310\lib\site-packages\lmdeploy\pytorch\backends\cuda\flash_attention.py”, line 56, in forward self.flash_attention_fwd( File “D:\python\MonkeyOCR\py310\lib\site-packages\lmdeploy\pytorch\kernels\cuda\flashattention.py”, line 449, in flash_attention_fwd _flash_prefill_fwd_kernel[grid]( File “D:\python\MonkeyOCR\py310\lib\site-packages\triton\runtime\jit.py”, line 345, in <lambda> return lambda *args, **kwargs: self.run(grid=grid, warmup=False, *args, **kwargs) File “D:\python\MonkeyOCR\py310\lib\site-packages\triton\runtime\jit.py”, line 691, in run kernel.run(grid_0, grid_1, grid_2, stream, kernel.function, kernel.packed_metadata, launch_metadata, File “D:\python\MonkeyOCR\py310\lib\site-packages\triton\compiler\compiler.py”, line 385, in __getattribute__ self._init_handles() File “D:\python\MonkeyOCR\py310\lib\site-packages\triton\compiler\compiler.py”, line 378, in _init_handles raise OutOfResources(self.metadata.shared, max_shared, “shared memory”) triton.runtime.errors.OutOfResources: out of resource: shared memory, Required: 126978, Hardware limit: 101376. Reducing block sizes or `num_stages` may help. 2025-07-01 12:43:43,759 – lmdeploy – ERROR – async_engine.py:791 – session 0 finished, reason “error”

主要错误就是:

triton.runtime.errors.OutOfResources: out of resource: shared memory, Required: 126978, Hardware limit: 101376. Reducing block sizes or `num_stages` may help.

意思就是共享内存资源不足,也就是共享显存不足

报错信息也给出了解决方法:

Reducing block sizes or `num_stages` may help

找到flashattention.py文件位置,我这里是:

\lib\site-packages\lmdeploy\pytorch\kernels\cuda\flashattention.py

找到num_stages值,

原代码是根据条件动态赋值的:

num_stages=num_stages,

我这里直接给设置了个小一点的固定值:

#num_stages=num_stages,
num_stages=2,

作为临时解决方案

重新运行程序不再发生报错。


AI软件用不了?2元爽玩4090: 立即体验>>

热门大语言模型API免费体验: 立即获取>>

软件催更及1对1人工答疑支持: https://nuowa.net/1806
赞(0) 打赏
软件无法使用?点击查看常见问题说明>>

最近更新

祝贺凡人修仙传2026年新年番开播同时在线人数超64万-诺瓦小站

祝贺凡人修仙传2026年新年番开播同时在线人数超64万

今天6月13日凡人修仙传新年番开播,同时在线人数破64万(非最高在线人数,只是我看到的在线人数),作为凡人5年老粉,必须发个帖祝贺一下。 我比较喜欢看动漫,各种类型看了很多,具体不清楚多少,像斗罗斗破之类看了一大半终究是没能看下去,还是雾山...

Claude居然自称“本人”-诺瓦小站

Claude居然自称“本人”

今天在和Claude聊网文写作的时候,Claude回复中居然自称本人,这让我有点震惊。 我经常会和AI聊工具功能对比等话题,ChatGPT、Gemini、Claude这些以前我记得从来没有自称过本人的,好像都是本模型,本工具等等,反正从来没...

免费在线HTML转markdown工具

经常看一些在线文档,想复制给AI参考的话不方便直接复制,转换成markdown再给AI阅读会更简单明了,也方便自己查阅,这里给大家推荐两个在线的免费HTML转markdown网站。 1、https://d1tools.com/tools/c...

觉得文章对你有帮助就打赏一下作者

非常感谢你的打赏,我将有更多的动力继续提供优质内容,让我们一起创建更加美好的世界!

支付宝扫一扫

微信扫一扫