测试环境使用qwen2.5 32b模型提高推理能力

topo_dev
DESKTOP-DDTUS3E\yaxin 5 months ago
parent 1706c3c326
commit 4abebd83f4

@ -7,7 +7,7 @@ spring:
chat:
enabled: true
options:
model: qwen2:7b
model: qwen2.5:32b
# 控制模型在请求后加载到内存中的时间(稍微长一点的时间,避免重复加载浪费性能,加快处理速度)
keep_alive: 30m
# 例如0.3

Loading…
Cancel
Save