intel 显卡跑 Qwen3-14B-GGUF:Q8_0

系统 win11
使用 https://www.modelscope.cn/models/Intel/ollama 设置环境变量 set ONEAPI_DEVICE_SELECTOR=level_zero:0 set SYCL_PI_LEVEL_ZERO_USE_IMMEDIATE_COMMANDLISTS=1 set OLLAMA_NUM_PARALLEL=1
start-ollama.bat
ollama run modelscope.cn/Qwen/Qwen3-14B-GGUF:Q8_0 大概十几 tokens/s ,因为我后台还开着其他东西不确定是否有影响,但是感觉显存不够,已经占用了一部分的系统内存.