系统 win11
使用
https://www.modelscope.cn/models/Intel/ollama
设置环境变量
set ONEAPI_DEVICE_SELECTOR=level_zero:0
set SYCL_PI_LEVEL_ZERO_USE_IMMEDIATE_COMMANDLISTS=1
set OLLAMA_NUM_PARALLEL=1
start-ollama.bat
ollama run modelscope.cn/Qwen/Qwen3-14B-GGUF:Q8_0
大概十几 tokens/s ,因为我后台还开着其他东西不确定是否有影响,但是感觉显存不够,已经占用了一部分的系统内存.
intel 显卡跑 Qwen3-14B-GGUF:Q8_0
内容版权声明:除非注明,否则皆为本站原创文章。
上一篇
perplexity 年度会员
下一篇
某搜索引擎给出错误的无铅焊锡温度