triton.runtime.errors.OutOfResources: out of resource: shared memory, Required: 126978, Hardware limit: 101376. Reducing block sizes or `num

今天在调试python应用MonkeyOCR的时候发生报错，部分错误信息如下：

File “D:\python\MonkeyOCR\py310\lib\site-packages\lmdeploy\pytorch\nn\attention.py”, line 154, in forward return self.impl.forward( File “D:\python\MonkeyOCR\py310\lib\site-packages\lmdeploy\pytorch\backends\cuda\flash_attention.py”, line 56, in forward self.flash_attention_fwd( File “D:\python\MonkeyOCR\py310\lib\site-packages\lmdeploy\pytorch\kernels\cuda\flashattention.py”, line 449, in flash_attention_fwd _flash_prefill_fwd_kernel[grid]( File “D:\python\MonkeyOCR\py310\lib\site-packages\triton\runtime\jit.py”, line 345, in <lambda> return lambda *args, **kwargs: self.run(grid=grid, warmup=False, *args, **kwargs) File “D:\python\MonkeyOCR\py310\lib\site-packages\triton\runtime\jit.py”, line 691, in run kernel.run(grid_0, grid_1, grid_2, stream, kernel.function, kernel.packed_metadata, launch_metadata, File “D:\python\MonkeyOCR\py310\lib\site-packages\triton\compiler\compiler.py”, line 385, in __getattribute__ self._init_handles() File “D:\python\MonkeyOCR\py310\lib\site-packages\triton\compiler\compiler.py”, line 378, in _init_handles raise OutOfResources(self.metadata.shared, max_shared, “shared memory”) triton.runtime.errors.OutOfResources: out of resource: shared memory, Required: 126978, Hardware limit: 101376. Reducing block sizes or `num_stages` may help. 2025-07-01 12:43:43,759 – lmdeploy – ERROR – async_engine.py:791 – session 0 finished, reason “error”

主要错误就是：

triton.runtime.errors.OutOfResources: out of resource: shared memory, Required: 126978, Hardware limit: 101376. Reducing block sizes or `num_stages` may help.

意思就是共享内存资源不足，也就是共享显存不足

报错信息也给出了解决方法：

Reducing block sizes or `num_stages` may help

找到flashattention.py文件位置，我这里是：

\lib\site-packages\lmdeploy\pytorch\kernels\cuda\flashattention.py

找到num_stages值，

原代码是根据条件动态赋值的：

num_stages=num_stages,

我这里直接给设置了个小一点的固定值：

#num_stages=num_stages,
num_stages=2,

作为临时解决方案

重新运行程序不再发生报错。

AI软件用不了？2元爽玩4090：立即体验>>

软件催更及1对1人工答疑支持： https://nuowa.net/1806

triton.runtime.errors.OutOfResources: out of resource: shared memory, Required: 126978, Hardware limit: 101376. Reducing block sizes or `num_stages` may help

相关推荐

最近更新

微软最新图片转3D网格模型软件TRELLIS.2 windows版整合包下载，AI一键建模工具

FunASR最新模型FunAudioLLM/Fun-ASR-Nano-2512实时语音识别转文字热词版整合包下载

Nova数字人虚拟主播软件下载

Crawl4AI：基于AI大语言模型的网络爬虫和数据抓取工具整合包软件下载

browser-use浏览器任务全自动化AI助手windows电脑版一键启动整合包

FlashVSR低分辨率模糊视频高清放大工具整合包v1.1下载，免安装一键启动

VibeVoice：富有表现力的长篇多人对话语音合成工具整合包下载

多图编辑人物一致性图片合成处理工具Qwen-Image-Edit-2509整合包下载，人物换装换姿势动作软件

摸鱼神器windows电脑隐藏任务栏软件图标工具rbtray下载

人物动作迁移及视频人物替换软件Wan2.2-Animate-14B整合包下载，动作模仿视频换主体工具在线一键启动

热门文章

觉得文章对你有帮助就打赏一下作者

非常感谢你的打赏，我将有更多的动力继续提供优质内容，让我们一起创建更加美好的世界！

支付宝扫一扫

微信扫一扫