Historie revizí

Autor SHA1 Zpráva Datum
  Jesse Gross f66216e399 ggml: Support heterogeneous KV cache layer sizes in memory estimation před 1 měsícem
  Parth Sareen 314573bfe8 config: allow setting context length through env var (#8938) před 2 měsíci
  Michael Yang 58245413f4 next ollama runner (#7913) před 2 měsíci
  Stefan Weil abfdc4710f all: fix typos in documentation, code, and comments (#7021) před 4 měsíci
  Sam 1bdab9fdb1 llm: introduce k/v context quantization (vRAM improvements) (#6279) před 5 měsíci
  Daniel Hiltgen 05cd82ef94 Rename gpu package discover (#7143) před 6 měsíci
  Michael Yang 77903ab8b4 llama3.1 před 9 měsíci
  Michael Yang b732beba6a lint před 9 měsíci
  Michael Yang df993fa37b comments před 9 měsíci
  Michael Yang 5e9db9fb0b refactor convert před 11 měsíci
  Michael Yang 35b89b2eab rfc: dynamic environ lookup před 10 měsíci
  Blake Mizerany cb42e607c5 llm: speed up gguf decoding by a lot (#5246) před 10 měsíci
  Daniel Hiltgen 6f351bf586 review comments and coverage před 11 měsíci
  Daniel Hiltgen 6fd04ca922 Improve multi-gpu handling at the limit před 11 měsíci