Selaa lähdekoodia

do not cache prompt (#2018)

- prompt cache causes inferance to hang after some time
Bruce MacDonald 1 vuosi sitten
vanhempi
commit
a897e833b8
1 muutettua tiedostoa jossa 0 lisäystä ja 1 poistoa
  1. 0 1
      llm/dyn_ext_server.go

+ 0 - 1
llm/dyn_ext_server.go

@@ -181,7 +181,6 @@ func (llm *dynExtServer) Predict(ctx context.Context, predict PredictOpts, fn fu
 		"seed":              predict.Options.Seed,
 		"stop":              predict.Options.Stop,
 		"image_data":        imageData,
-		"cache_prompt":      true,
 	}
 
 	if predict.Format == "json" {