AI软件下载
有趣网站推荐及实用软件下载

triton.runtime.errors.OutOfResources: out of resource: shared memory, Required: 126978, Hardware limit: 101376. Reducing block sizes or `num_stages` may help

今天在调试python应用MonkeyOCR的时候发生报错,部分错误信息如下:

File “D:\python\MonkeyOCR\py310\lib\site-packages\lmdeploy\pytorch\nn\attention.py”, line 154, in forward return self.impl.forward( File “D:\python\MonkeyOCR\py310\lib\site-packages\lmdeploy\pytorch\backends\cuda\flash_attention.py”, line 56, in forward self.flash_attention_fwd( File “D:\python\MonkeyOCR\py310\lib\site-packages\lmdeploy\pytorch\kernels\cuda\flashattention.py”, line 449, in flash_attention_fwd _flash_prefill_fwd_kernel[grid]( File “D:\python\MonkeyOCR\py310\lib\site-packages\triton\runtime\jit.py”, line 345, in <lambda> return lambda *args, **kwargs: self.run(grid=grid, warmup=False, *args, **kwargs) File “D:\python\MonkeyOCR\py310\lib\site-packages\triton\runtime\jit.py”, line 691, in run kernel.run(grid_0, grid_1, grid_2, stream, kernel.function, kernel.packed_metadata, launch_metadata, File “D:\python\MonkeyOCR\py310\lib\site-packages\triton\compiler\compiler.py”, line 385, in __getattribute__ self._init_handles() File “D:\python\MonkeyOCR\py310\lib\site-packages\triton\compiler\compiler.py”, line 378, in _init_handles raise OutOfResources(self.metadata.shared, max_shared, “shared memory”) triton.runtime.errors.OutOfResources: out of resource: shared memory, Required: 126978, Hardware limit: 101376. Reducing block sizes or `num_stages` may help. 2025-07-01 12:43:43,759 – lmdeploy – ERROR – async_engine.py:791 – session 0 finished, reason “error”

主要错误就是:

triton.runtime.errors.OutOfResources: out of resource: shared memory, Required: 126978, Hardware limit: 101376. Reducing block sizes or `num_stages` may help.

意思就是共享内存资源不足,也就是共享显存不足

报错信息也给出了解决方法:

Reducing block sizes or `num_stages` may help

找到flashattention.py文件位置,我这里是:

\lib\site-packages\lmdeploy\pytorch\kernels\cuda\flashattention.py

找到num_stages值,

原代码是根据条件动态赋值的:

num_stages=num_stages,

我这里直接给设置了个小一点的固定值:

#num_stages=num_stages,
num_stages=2,

作为临时解决方案

重新运行程序不再发生报错。


AI软件用不了?2元爽玩4090: 立即体验>>

热门大语言模型API免费体验: 立即获取>>

软件催更及1对1人工答疑支持: https://nuowa.net/1806
赞(0) 打赏
软件无法使用?点击查看常见问题说明>>

最近更新

优云智算HappyHorse AI 视频生成API KEY WebUI-诺瓦小站

优云智算HappyHorse AI 视频生成API KEY WebUI

大家可能平常刷视频的时候已经发现了,进入2026年AI短剧极其火爆,不管是短视频平台还是拼多多等购物平台,短剧视频里经常能刷到AI漫剧。前几年短剧公司拍真人短剧赚的盆满钵满,进入2026年短剧公司被AI打的毫无还手之力。借助AI的快速发展,...

LTX-2.3 视频生成免安装部署整合包软件下载-诺瓦小站

LTX-2.3 视频生成免安装部署整合包软件下载

LTX-2 是由 Lightricks 开发的首个基于 DiT(扩散变换器)架构的音视频基础模型,能够在一个统一模型中同时生成高质量的视频与同步音频。与以往需要分别处理视频和音频的方案不同,LTX-2 将两者深度融合,实现真正的音画同步生成...

PDF转word软件FreeP2W免安装版下载

这软件还是很早的时候一个用户让做的,发现没分享过,现在分享一下。 软件主要功能就是把PDF文档转换为word文档 软件使用很简单,把需要处理的pdf文档复制到input文件夹内,双击启动软件.exe,等待处理完成即可。 注意事项 软件只支持...

FunASR语音识别转文字软件区分说话人版-诺瓦小站

FunASR语音识别转文字软件区分说话人版

FunASR是一款优秀的基础语音识别框架,配合阿里通义团队开发的其它语音识别模型,能够实现非常好语音转文字效果,尤其在中文语音识别方面,鉴于有些用户需要对语音识别内容区分说话人,我重新做了一版区分说话人的版本。软件支持多语言识别,但是还是尽...

觉得文章对你有帮助就打赏一下作者

非常感谢你的打赏,我将有更多的动力继续提供优质内容,让我们一起创建更加美好的世界!

支付宝扫一扫

微信扫一扫