Histórico de Commits

Autor SHA1 Mensagem Data
  Blake Mizerany cb42e607c5 llm: speed up gguf decoding by a lot (#5246) há 10 meses atrás
  Michael Yang 8e0641a9bf handle asymmetric embedding KVs há 10 meses atrás
  Michael Yang e873841cbb deepseek v2 graph há 10 meses atrás
  Daniel Hiltgen 6fd04ca922 Improve multi-gpu handling at the limit há 11 meses atrás
  Michael Yang 7bdcd1da94 Revert "Merge pull request #4938 from ollama/mxyng/fix-byte-order" há 10 meses atrás
  Michael Yang 620d5c569e fix parsing big endian gguf há 11 meses atrás
  Michael Yang 9b6c2e6eb6 detect chat template from KV há 11 meses atrás
  Michael Yang d51f15257c Update llm/ggml.go há 11 meses atrás
  Michael Yang 8f440d579a fix q5_0, q5_1 há 11 meses atrás
  Bruce MacDonald d6f692ad1a Add support for IQ1_S, IQ3_S, IQ2_S, IQ4_XS. IQ4_NL (#4322) há 11 meses atrás
  Michael Yang 171eb040fc simplify safetensors reading há 11 meses atrás
  Michael Yang 1eb382da5a add phi2 mem há 1 ano atrás
  Michael Yang eeb695261f skip if same quantization há 1 ano atrás
  Michael Yang 01811c176a comments há 1 ano atrás
  Michael Yang 9685c34509 quantize any fp16/fp32 model há 1 ano atrás
  Michael Yang 435cc866a3 fix: mixtral graph há 1 ano atrás
  Michael Yang 3cf483fe48 add stablelm graph calculation há 1 ano atrás
  Michael Yang a8b9b930b4 account for all non-repeating layers há 1 ano atrás
  Michael Yang 3397eff0cd mixtral mem há 1 ano atrás
  Michael Yang 7e33a017c0 partial offloading há 1 ano atrás
  Michael Yang 8b2c10061c refactor tensor query há 1 ano atrás
  Michael Yang 01f77ae25d add command-r graph estimate há 1 ano atrás
  Michael Yang 12e923e158 update graph size estimate há 1 ano atrás
  Michael Yang 90f071c658 default head_kv to 1 há 1 ano atrás
  Michael Yang 91b3e4d282 update memory calcualtions há 1 ano atrás
  Michael Yang d338d70492 refactor model parsing há 1 ano atrás
  Patrick Devine 5a5efee46b Add gemma safetensors conversion (#3250) há 1 ano atrás
  Michael Yang 0085297928 refactor readseeker há 1 ano atrás
  Michael Yang 76bdebbadf decode ggla há 1 ano atrás
  Patrick Devine 2c017ca441 Convert Safetensors to an Ollama model (#2824) há 1 ano atrás