同志们啊 求助
我在windows上用ollama+web UI跑模型
显卡是双路2080TI 22G
跑千问3.0 32B模型双路显卡都能调用,没问题
但是跑DS-70B模型是CPU满载欸,显卡基本就不调用,这是什么道理啊。
真的虚心求教怎么修,32B的精度对比之下真的有点差强人意😭😭😭
我在windows上用ollama+web UI跑模型
显卡是双路2080TI 22G
跑千问3.0 32B模型双路显卡都能调用,没问题
但是跑DS-70B模型是CPU满载欸,显卡基本就不调用,这是什么道理啊。
真的虚心求教怎么修,32B的精度对比之下真的有点差强人意😭😭😭