Historia zmian

Autor SHA1 Wiadomość Data
  Jeffrey Morgan 7da249fcc1 only build metal for `darwin,arm` target 1 rok temu
  Bruce MacDonald 184ad8f057 allow specifying stop conditions in modelfile 1 rok temu
  Michael Yang 3549676678 embed ggml-metal.metal 1 rok temu
  Michael Yang fadf75f99d add stop conditions 1 rok temu
  Michael Yang ad3a7d0e2c add NumGQA 1 rok temu
  Michael Yang cca61181cb sample metrics 1 rok temu
  Michael Yang c490416189 lock on llm.lock(); decrease batch size 1 rok temu
  Michael Yang f62a882760 add session expiration 1 rok temu
  Michael Yang 3003fc03fc update predict code 1 rok temu
  Michael Yang 35af37a2cb session id 1 rok temu
  Michael Yang 726bc647b2 enable k quants 1 rok temu
  Michael Yang cb55fa9270 enable accelerate 1 rok temu
  Michael Yang b71c67b6ba allocate a large enough tokens slice 1 rok temu
  Michael Yang 40c9dc0a31 fix multibyte responses 1 rok temu
  Michael Yang 0142660bd4 size_t 1 rok temu
  Michael Yang 1775647f76 continue conversation 1 rok temu
  Michael Yang 05e08d2310 return more info in generate response 1 rok temu
  Michael Yang e1f0a0dc74 fix eof error in generate 1 rok temu
  Jeffrey Morgan c63f811909 return error if model fails to load 1 rok temu
  Michael Yang 442dec1c6f vendor llama.cpp 1 rok temu
  Michael Yang fd4792ec56 call llama.cpp directly from go 1 rok temu
  Jeffrey Morgan 5fb96255dc llama: remove unused helper functions 1 rok temu
  Patrick Devine 3f1b7177f2 pass model and predict options 1 rok temu
  Michael Yang 5dc9c8ff23 more free 1 rok temu
  Bruce MacDonald da74384a3e remove prompt cache 1 rok temu
  Michael Yang 2c80eddd71 more free 1 rok temu
  Jeffrey Morgan 9fe018675f use `Makefile` for dependency building instead of `go generate` 1 rok temu
  Jeffrey Morgan 0998d4f0a4 remove debug print statements 1 rok temu
  Jeffrey Morgan 79a999e95d fix crash in bindings 1 rok temu
  Jeffrey Morgan fd962a36e5 client updates 1 rok temu