Historique des commits

Auteur SHA1 Message Date
  Daniel Hiltgen f86d00cd95 llama: add compiler tags for cpu features (#7137) il y a 7 mois
  Gabe Goodhart f2890a4494 IBM granite/granitemoe architecture support (#6760) il y a 7 mois
  Daniel Hiltgen 7d6eb0d4c3 Move macos v11 support flags to build script (#7203) il y a 7 mois
  Daniel Hiltgen 5dd0477fd4 Fix regression on older macos versions (#7192) il y a 7 mois
  Jeffrey Morgan 96efd9052f Re-introduce the `llama` package (#5034) il y a 7 mois
  Michael Yang fccf8d179f partial decode ggml bin for more info il y a 1 an
  Bruce MacDonald 984c9c628c fix embeddings invalid values il y a 1 an
  Bruce MacDonald 09d8bf6730 fix build errors il y a 1 an
  Bruce MacDonald 7a5f3616fd embed text document in modelfile il y a 1 an
  Michael Yang f2074ed4c0 Merge pull request #306 from jmorganca/default-keep-system il y a 1 an
  Bruce MacDonald a6f6d18f83 embed text document in modelfile il y a 1 an
  Jeffrey Morgan 5eb712f962 trim whitespace before checking stop conditions il y a 1 an
  Michael Yang 4dc5b117dd automatically set num_keep if num_keep < 0 il y a 1 an
  Michael Yang b9f4d67554 configurable rope frequency parameters il y a 1 an
  Michael Yang c5bcf32823 update llama.cpp il y a 1 an
  Michael Yang 74a5f7e698 no gpu for 70B model il y a 1 an
  Michael Yang 319f078dd9 remove -Werror il y a 1 an
  Jeffrey Morgan 7da249fcc1 only build metal for `darwin,arm` target il y a 1 an
  Bruce MacDonald 184ad8f057 allow specifying stop conditions in modelfile il y a 1 an
  Michael Yang 3549676678 embed ggml-metal.metal il y a 1 an
  Michael Yang fadf75f99d add stop conditions il y a 1 an
  Michael Yang ad3a7d0e2c add NumGQA il y a 1 an
  Michael Yang cca61181cb sample metrics il y a 1 an
  Michael Yang c490416189 lock on llm.lock(); decrease batch size il y a 1 an
  Michael Yang f62a882760 add session expiration il y a 1 an
  Michael Yang 3003fc03fc update predict code il y a 1 an
  Michael Yang 35af37a2cb session id il y a 1 an
  Michael Yang 726bc647b2 enable k quants il y a 1 an
  Michael Yang cb55fa9270 enable accelerate il y a 1 an
  Michael Yang b71c67b6ba allocate a large enough tokens slice il y a 1 an