测试环境使用qwen2.5 32b模型提高推理能力

10 months ago · 4abebd83f4
parent 1706c3c326
commit 4abebd83f4
1 changed files with 1 additions and 1 deletions
--- a/src/main/resources/application-test.yml
+++ b/src/main/resources/application-test.yml
@ -7,7 +7,7 @@ spring:
      chat:
        enabled: true
        options:
-          model: qwen2:7b
+          model: qwen2.5:32b
          # 控制模型在请求后加载到内存中的时间(稍微长一点的时间,避免重复加载浪费性能,加快处理速度)
          keep_alive: 30m
          # 例如0.3