Commit History

Author SHA1 Message Date
  Michael Yang 620d5c569e fix parsing big endian gguf 11 months ago
  Michael Yang 9b6c2e6eb6 detect chat template from KV 11 months ago
  Michael Yang d51f15257c Update llm/ggml.go 11 months ago
  Michael Yang 8f440d579a fix q5_0, q5_1 11 months ago
  Bruce MacDonald d6f692ad1a Add support for IQ1_S, IQ3_S, IQ2_S, IQ4_XS. IQ4_NL (#4322) 11 months ago
  Michael Yang 171eb040fc simplify safetensors reading 11 months ago
  Michael Yang 1eb382da5a add phi2 mem 1 year ago
  Michael Yang eeb695261f skip if same quantization 1 year ago
  Michael Yang 01811c176a comments 1 year ago
  Michael Yang 9685c34509 quantize any fp16/fp32 model 1 year ago
  Michael Yang 435cc866a3 fix: mixtral graph 1 year ago
  Michael Yang 3cf483fe48 add stablelm graph calculation 1 year ago
  Michael Yang a8b9b930b4 account for all non-repeating layers 1 year ago
  Michael Yang 3397eff0cd mixtral mem 1 year ago
  Michael Yang 7e33a017c0 partial offloading 1 year ago
  Michael Yang 8b2c10061c refactor tensor query 1 year ago
  Michael Yang 01f77ae25d add command-r graph estimate 1 year ago
  Michael Yang 12e923e158 update graph size estimate 1 year ago
  Michael Yang 90f071c658 default head_kv to 1 1 year ago
  Michael Yang 91b3e4d282 update memory calcualtions 1 year ago
  Michael Yang d338d70492 refactor model parsing 1 year ago
  Patrick Devine 5a5efee46b Add gemma safetensors conversion (#3250) 1 year ago
  Michael Yang 0085297928 refactor readseeker 1 year ago
  Michael Yang 76bdebbadf decode ggla 1 year ago
  Patrick Devine 2c017ca441 Convert Safetensors to an Ollama model (#2824) 1 year ago
  Michael Yang 949d7b1c48 add gguf file types (#2532) 1 year ago
  Michael Yang eaed6f8c45 add max context length check 1 year ago
  Michael Yang 2bb2bdd5d4 fix lint 1 year ago
  Jeffrey Morgan 08f1e18965 Offload layers to GPU based on new model size estimates (#1850) 1 year ago
  Bruce MacDonald 811b1f03c8 deprecate ggml 1 year ago