Историја ревизија

Аутор SHA1 Порука Датум
  Sam 1bdab9fdb1 llm: introduce k/v context quantization (vRAM improvements) (#6279) пре 5 месеци
  Michael Yang d07cf41a97 refactor kv estimation пре 6 месеци
  Michael Yang 8c238e70ab mllama cross attention пре 6 месеци
  Patrick Devine c7cb0f0602 image processing for llama3.2 (#6963) пре 6 месеци
  frob 09035b71cd Add missing BF16 tensor type. (#7193) пре 6 месеци
  Michael Yang bf612cd608 Merge pull request #6260 from ollama/mxyng/mem пре 8 месеци
  Patrick Devine 0c819e167b convert safetensor adapters into GGUF (#6327) пре 8 месеци
  Michael Yang 6ffb5cb017 add conversion for microsoft phi 3 mini/medium 4k, 128 пре 11 месеци
  Michael Yang 2003d60159 llama3.1 memory пре 9 месеци
  Michael Yang 6b252918fb update convert test to check result data пре 11 месеци
  Michael Yang 5a739ff4cb chatglm graph пре 10 месеци
  Michael Yang de2163dafd gemma2 graph пре 10 месеци
  Blake Mizerany cb42e607c5 llm: speed up gguf decoding by a lot (#5246) пре 10 месеци
  Michael Yang 8e0641a9bf handle asymmetric embedding KVs пре 10 месеци
  Michael Yang e873841cbb deepseek v2 graph пре 10 месеци
  Daniel Hiltgen 6fd04ca922 Improve multi-gpu handling at the limit пре 11 месеци
  Michael Yang 7bdcd1da94 Revert "Merge pull request #4938 from ollama/mxyng/fix-byte-order" пре 10 месеци
  Michael Yang 620d5c569e fix parsing big endian gguf пре 11 месеци
  Michael Yang 9b6c2e6eb6 detect chat template from KV пре 11 месеци
  Michael Yang d51f15257c Update llm/ggml.go пре 11 месеци
  Michael Yang 8f440d579a fix q5_0, q5_1 пре 11 месеци
  Bruce MacDonald d6f692ad1a Add support for IQ1_S, IQ3_S, IQ2_S, IQ4_XS. IQ4_NL (#4322) пре 11 месеци
  Michael Yang 171eb040fc simplify safetensors reading пре 11 месеци
  Michael Yang 1eb382da5a add phi2 mem пре 1 година
  Michael Yang eeb695261f skip if same quantization пре 1 година
  Michael Yang 01811c176a comments пре 1 година
  Michael Yang 9685c34509 quantize any fp16/fp32 model пре 1 година
  Michael Yang 435cc866a3 fix: mixtral graph пре 1 година
  Michael Yang 3cf483fe48 add stablelm graph calculation пре 1 година
  Michael Yang a8b9b930b4 account for all non-repeating layers пре 1 година