@ -7,7 +7,7 @@ spring:
chat:
enabled: true
options:
model: qwen2:7b
model: qwen2.5:32b
# 控制模型在请求后加载到内存中的时间(稍微长一点的时间,避免重复加载浪费性能,加快处理速度)
keep_alive: 30m
# 例如0.3