소스 검색

do not cache prompt (#2018)

- prompt cache causes inferance to hang after some time
Bruce MacDonald 1 년 전
부모
커밋
a897e833b8
1개의 변경된 파일0개의 추가작업 그리고 1개의 파일을 삭제
  1. 0 1
      llm/dyn_ext_server.go

+ 0 - 1
llm/dyn_ext_server.go

@@ -181,7 +181,6 @@ func (llm *dynExtServer) Predict(ctx context.Context, predict PredictOpts, fn fu
 		"seed":              predict.Options.Seed,
 		"stop":              predict.Options.Stop,
 		"image_data":        imageData,
-		"cache_prompt":      true,
 	}
 
 	if predict.Format == "json" {