Historique des commits

Auteur SHA1 Message Date
  Michael Yang d51f15257c Update llm/ggml.go il y a 11 mois
  Michael Yang 8f440d579a fix q5_0, q5_1 il y a 11 mois
  Bruce MacDonald d6f692ad1a Add support for IQ1_S, IQ3_S, IQ2_S, IQ4_XS. IQ4_NL (#4322) il y a 11 mois
  Michael Yang 171eb040fc simplify safetensors reading il y a 11 mois
  Michael Yang 1eb382da5a add phi2 mem il y a 1 an
  Michael Yang eeb695261f skip if same quantization il y a 1 an
  Michael Yang 01811c176a comments il y a 1 an
  Michael Yang 9685c34509 quantize any fp16/fp32 model il y a 1 an
  Michael Yang 435cc866a3 fix: mixtral graph il y a 1 an
  Michael Yang 3cf483fe48 add stablelm graph calculation il y a 1 an
  Michael Yang a8b9b930b4 account for all non-repeating layers il y a 1 an
  Michael Yang 3397eff0cd mixtral mem il y a 1 an
  Michael Yang 7e33a017c0 partial offloading il y a 1 an
  Michael Yang 8b2c10061c refactor tensor query il y a 1 an
  Michael Yang 01f77ae25d add command-r graph estimate il y a 1 an
  Michael Yang 12e923e158 update graph size estimate il y a 1 an
  Michael Yang 90f071c658 default head_kv to 1 il y a 1 an
  Michael Yang 91b3e4d282 update memory calcualtions il y a 1 an
  Michael Yang d338d70492 refactor model parsing il y a 1 an
  Patrick Devine 5a5efee46b Add gemma safetensors conversion (#3250) il y a 1 an
  Michael Yang 0085297928 refactor readseeker il y a 1 an
  Michael Yang 76bdebbadf decode ggla il y a 1 an
  Patrick Devine 2c017ca441 Convert Safetensors to an Ollama model (#2824) il y a 1 an
  Michael Yang 949d7b1c48 add gguf file types (#2532) il y a 1 an
  Michael Yang eaed6f8c45 add max context length check il y a 1 an
  Michael Yang 2bb2bdd5d4 fix lint il y a 1 an
  Jeffrey Morgan 08f1e18965 Offload layers to GPU based on new model size estimates (#1850) il y a 1 an
  Bruce MacDonald 811b1f03c8 deprecate ggml il y a 1 an
  Jeffrey Morgan d9a250e9b5 seek to end of file when decoding older model formats il y a 1 an
  Jeffrey Morgan 944519ed16 seek to eof for older model binaries il y a 1 an