Историја ревизија

Аутор SHA1 Порука Датум
  Michael Yang 435cc866a3 fix: mixtral graph пре 1 година
  Michael Yang 3cf483fe48 add stablelm graph calculation пре 1 година
  Michael Yang a8b9b930b4 account for all non-repeating layers пре 1 година
  Michael Yang 3397eff0cd mixtral mem пре 1 година
  Michael Yang 7e33a017c0 partial offloading пре 1 година
  Michael Yang 8b2c10061c refactor tensor query пре 1 година
  Michael Yang 01f77ae25d add command-r graph estimate пре 1 година
  Michael Yang 12e923e158 update graph size estimate пре 1 година
  Michael Yang 90f071c658 default head_kv to 1 пре 1 година
  Michael Yang 91b3e4d282 update memory calcualtions пре 1 година
  Michael Yang d338d70492 refactor model parsing пре 1 година
  Patrick Devine 5a5efee46b Add gemma safetensors conversion (#3250) пре 1 година
  Michael Yang 0085297928 refactor readseeker пре 1 година
  Michael Yang 76bdebbadf decode ggla пре 1 година
  Patrick Devine 2c017ca441 Convert Safetensors to an Ollama model (#2824) пре 1 година
  Michael Yang 949d7b1c48 add gguf file types (#2532) пре 1 година
  Michael Yang eaed6f8c45 add max context length check пре 1 година
  Michael Yang 2bb2bdd5d4 fix lint пре 1 година
  Jeffrey Morgan 08f1e18965 Offload layers to GPU based on new model size estimates (#1850) пре 1 година
  Bruce MacDonald 811b1f03c8 deprecate ggml пре 1 година
  Jeffrey Morgan d9a250e9b5 seek to end of file when decoding older model formats пре 1 година
  Jeffrey Morgan 944519ed16 seek to eof for older model binaries пре 1 година
  Michael Yang 72e7a49aa9 seek instead of copyn пре 1 година
  Michael Yang 2cb0fa7d40 split from into one or more models пре 1 година
  Michael Yang b2816bca67 unnecessary ReadSeeker for DecodeGGML пре 1 година
  Michael Yang 125d0a013a ggufv3 пре 1 година
  Michael Yang c02c0cd483 starcoder пре 1 година
  Bruce MacDonald 86279f4ae3 unbound max num gpu layers (#591) пре 1 година
  Bruce MacDonald 4cba75efc5 remove tmp directories created by previous servers (#559) пре 1 година
  Bruce MacDonald 66003e1d05 subprocess improvements (#524) пре 1 година