Commit History

Автор SHA1 Съобщение Дата
  Blake Mizerany cb42e607c5 llm: speed up gguf decoding by a lot (#5246) преди 10 месеца
  Michael Yang 7bdcd1da94 Revert "Merge pull request #4938 from ollama/mxyng/fix-byte-order" преди 10 месеца
  Michael Yang 620d5c569e fix parsing big endian gguf преди 10 месеца
  Michael Yang 030e765e76 fix create model when template detection errors преди 11 месеца
  Michael Yang e40145a39d lint преди 11 месеца
  Michael Yang 171eb040fc simplify safetensors reading преди 11 месеца
  Michael Yang bbbd9f20f3 cleanup преди 11 месеца
  Michael Yang 547132e820 bpe pretokenizer преди 11 месеца
  Patrick Devine c8cf0d94ed llama3 conversion преди 1 година
  Patrick Devine 14476d48cc fixes for gguf (#3863) преди 1 година
  Michael Yang e74163af4c fix padding to only return padding преди 1 година
  Michael Yang 6d53b67c2c Merge pull request #3663 from ollama/mxyng/fix-padding преди 1 година
  Michael Yang 969238b19e fix padding in decode преди 1 година
  Patrick Devine 9f8691c6c8 Add llama2 / torch models for `ollama create` (#3607) преди 1 година
  Michael Yang 8b2c10061c refactor tensor query преди 1 година
  Michael Yang d338d70492 refactor model parsing преди 1 година
  Patrick Devine 5a5efee46b Add gemma safetensors conversion (#3250) преди 1 година
  Patrick Devine 1b272d5bcd change `github.com/jmorganca/ollama` to `github.com/ollama/ollama` (#3347) преди 1 година
  Michael Yang 22f326464e Merge pull request #3083 from ollama/mxyng/refactor-readseeker преди 1 година
  Blake Mizerany 6ce37e4d96 llm,readline: use errors.Is instead of simple == check (#3161) преди 1 година
  Michael Yang 0085297928 refactor readseeker преди 1 година
  Michael Yang 76bdebbadf decode ggla преди 1 година
  Patrick Devine 2c017ca441 Convert Safetensors to an Ollama model (#2824) преди 1 година
  Michael Yang 949d7b1c48 add gguf file types (#2532) преди 1 година
  Michael Yang cd22855ef8 refactor tensor read преди 1 година
  Michael Yang eaed6f8c45 add max context length check преди 1 година
  Jeffrey Morgan 08f1e18965 Offload layers to GPU based on new model size estimates (#1850) преди 1 година
  Michael Yang 56ffc3023a remove per-model types преди 1 година
  Michael Yang 5a5dca13b2 comments преди 1 година
  Michael Yang 72e7a49aa9 seek instead of copyn преди 1 година