Историја ревизија

Аутор SHA1 Порука Датум
  Michael Yang 74bd09652d ml/backend/ggml: load tensors in 32KiB chunks пре 1 месец
  Bruce MacDonald df94175a0f ggml: return error on failure to read tensor data (#9872) пре 1 месец
  Michael Yang 021dcf089d Merge pull request #9824 from ollama/mxyng/sched пре 1 месец
  Jeffrey Morgan 364629b8d6 ml/backend/ggml: allocate memory with malloc when loading model (#9822) пре 1 месец
  Michael Yang 4561fff36e conditionally enable parallel pipelines пре 1 месец
  Michael Yang 63a394068c use 2d pooling пре 1 месец
  Michael Yang c5cbe4fc2a fallback to cpu пре 1 месец
  Michael Yang 9e4642e9b3 ollama debug tensor пре 1 месец
  Michael Yang 6b0486c216 duplicate token_embd to output пре 1 месец
  Michael Yang 8934324b72 use fast attention пре 1 месец
  Michael Yang 0df1800436 set non-causal attention пре 1 месец
  Michael Yang 4b037a97dc add gemma vision encoder пре 1 месец
  Patrick Devine 5f74d1fd47 gemma2 impl пре 2 месеци
  Jesse Gross 4100ed7bdd ml: Add support for quantized KV cache пре 2 месеци
  Jesse Gross 25f9b152f9 ggml-backend: Ensure allocation meet backend requirements пре 1 месец
  Jesse Gross 98272fbd58 additional review comments пре 1 месец
  Michael Yang b27e8f3f10 ml/backend/ggml: use backend buffer type пре 1 месец
  Michael Yang 45df786f09 comments пре 1 месец
  Michael Yang daaf42e4a4 ml/backend/ggml: clean up пре 2 месеци
  Michael Yang 2dc60d4620 ml/backend/ggml: offload vision to cpu пре 2 месеци
  Michael Yang b5312f30e8 ml/backend/ggml: handle tensor split пре 2 месеци
  Michael Yang 26c2e0bd35 ml/backend/ggml: handle user specified cpu offloading пре 2 месеци
  Michael Yang bf920883d5 ml/backend/ggml: set cpu n_threads пре 2 месеци
  Michael Yang 7bae7fa5ce ml/backend/ggml: create tensor on specific backend пре 2 месеци
  Michael Yang 764e199d67 kvcache: create cache ctx per layer пре 2 месеци
  Michael Yang bfce55db3d model: load non-repeated tensors into multiple backends пре 2 месеци
  Michael Yang bab6f34dc0 ml/backend/ggml: update model loading for hybrid/multi backends пре 2 месеци
  Michael Yang 05a01fdecb ml/backend/ggml: consolidate system info logging пре 2 месеци
  Jesse Gross 21aa666a1e ml: Enable support for flash attention пре 2 месеци
  Jesse Gross ee141cc821 ml: Empty tensor constructor for tensors пре 2 месеци