ソースを参照

lower batch size to 512

Jeffrey Morgan 1 年間 前
コミット
822a0e36eb
1 ファイル変更1 行追加1 行削除
  1. 1 1
      api/types.go

+ 1 - 1
api/types.go

@@ -190,7 +190,7 @@ func DefaultOptions() Options {
 		UseNUMA: false,
 
 		NumCtx:   2048,
-		NumBatch: 1024,
+		NumBatch: 512,
 		NumGPU:   1,
 		NumGQA:   1,
 		LowVRAM:  false,