Commit History

Autor SHA1 Mensaxe Data
  jmorganca e86db9381a `avx2` should only add `avx2` hai 11 meses
  jmorganca 9fe48978a8 move `runner` package down hai 11 meses
  jmorganca 01ccbc07fe replace static build in `llm` hai 11 meses
  jmorganca 0110994d06 Initial `llama` Go module hai 1 ano
  jmorganca 2ef3a217d1 add sync of llama.cpp hai 1 ano
  Michael Yang fccf8d179f partial decode ggml bin for more info hai 1 ano
  Bruce MacDonald 984c9c628c fix embeddings invalid values hai 1 ano
  Bruce MacDonald 09d8bf6730 fix build errors hai 1 ano
  Bruce MacDonald 7a5f3616fd embed text document in modelfile hai 1 ano
  Michael Yang f2074ed4c0 Merge pull request #306 from jmorganca/default-keep-system hai 1 ano
  Bruce MacDonald a6f6d18f83 embed text document in modelfile hai 1 ano
  Jeffrey Morgan 5eb712f962 trim whitespace before checking stop conditions hai 1 ano
  Michael Yang 4dc5b117dd automatically set num_keep if num_keep < 0 hai 1 ano
  Michael Yang b9f4d67554 configurable rope frequency parameters hai 1 ano
  Michael Yang c5bcf32823 update llama.cpp hai 1 ano
  Michael Yang 74a5f7e698 no gpu for 70B model hai 1 ano
  Michael Yang 319f078dd9 remove -Werror hai 1 ano
  Jeffrey Morgan 7da249fcc1 only build metal for `darwin,arm` target hai 1 ano
  Bruce MacDonald 184ad8f057 allow specifying stop conditions in modelfile hai 1 ano
  Michael Yang 3549676678 embed ggml-metal.metal hai 1 ano
  Michael Yang fadf75f99d add stop conditions hai 1 ano
  Michael Yang ad3a7d0e2c add NumGQA hai 1 ano
  Michael Yang cca61181cb sample metrics hai 1 ano
  Michael Yang c490416189 lock on llm.lock(); decrease batch size hai 1 ano
  Michael Yang f62a882760 add session expiration hai 1 ano
  Michael Yang 3003fc03fc update predict code hai 1 ano
  Michael Yang 35af37a2cb session id hai 1 ano
  Michael Yang 726bc647b2 enable k quants hai 1 ano
  Michael Yang cb55fa9270 enable accelerate hai 1 ano
  Michael Yang b71c67b6ba allocate a large enough tokens slice hai 1 ano