提交歷史

作者 SHA1 備註 提交日期
  Sam 1bdab9fdb1 llm: introduce k/v context quantization (vRAM improvements) (#6279) 5 月之前
  Michael Yang d07cf41a97 refactor kv estimation 6 月之前
  Michael Yang 8c238e70ab mllama cross attention 6 月之前
  Patrick Devine c7cb0f0602 image processing for llama3.2 (#6963) 6 月之前
  frob 09035b71cd Add missing BF16 tensor type. (#7193) 6 月之前
  Michael Yang bf612cd608 Merge pull request #6260 from ollama/mxyng/mem 8 月之前
  Patrick Devine 0c819e167b convert safetensor adapters into GGUF (#6327) 8 月之前
  Michael Yang 6ffb5cb017 add conversion for microsoft phi 3 mini/medium 4k, 128 11 月之前
  Michael Yang 2003d60159 llama3.1 memory 8 月之前
  Michael Yang 6b252918fb update convert test to check result data 11 月之前
  Michael Yang 5a739ff4cb chatglm graph 9 月之前
  Michael Yang de2163dafd gemma2 graph 10 月之前
  Blake Mizerany cb42e607c5 llm: speed up gguf decoding by a lot (#5246) 10 月之前
  Michael Yang 8e0641a9bf handle asymmetric embedding KVs 10 月之前
  Michael Yang e873841cbb deepseek v2 graph 10 月之前
  Daniel Hiltgen 6fd04ca922 Improve multi-gpu handling at the limit 11 月之前
  Michael Yang 7bdcd1da94 Revert "Merge pull request #4938 from ollama/mxyng/fix-byte-order" 10 月之前
  Michael Yang 620d5c569e fix parsing big endian gguf 10 月之前
  Michael Yang 9b6c2e6eb6 detect chat template from KV 11 月之前
  Michael Yang d51f15257c Update llm/ggml.go 11 月之前
  Michael Yang 8f440d579a fix q5_0, q5_1 11 月之前
  Bruce MacDonald d6f692ad1a Add support for IQ1_S, IQ3_S, IQ2_S, IQ4_XS. IQ4_NL (#4322) 11 月之前
  Michael Yang 171eb040fc simplify safetensors reading 11 月之前
  Michael Yang 1eb382da5a add phi2 mem 11 月之前
  Michael Yang eeb695261f skip if same quantization 1 年之前
  Michael Yang 01811c176a comments 1 年之前
  Michael Yang 9685c34509 quantize any fp16/fp32 model 1 年之前
  Michael Yang 435cc866a3 fix: mixtral graph 1 年之前
  Michael Yang 3cf483fe48 add stablelm graph calculation 1 年之前
  Michael Yang a8b9b930b4 account for all non-repeating layers 1 年之前