Historial de Commits

Autor SHA1 Mensaje Fecha
  Patrick Devine 14476d48cc fixes for gguf (#3863) hace 1 año
  Michael Yang e74163af4c fix padding to only return padding hace 1 año
  Michael Yang 6d53b67c2c Merge pull request #3663 from ollama/mxyng/fix-padding hace 1 año
  Michael Yang 969238b19e fix padding in decode hace 1 año
  Patrick Devine 9f8691c6c8 Add llama2 / torch models for `ollama create` (#3607) hace 1 año
  Michael Yang 8b2c10061c refactor tensor query hace 1 año
  Michael Yang d338d70492 refactor model parsing hace 1 año
  Patrick Devine 5a5efee46b Add gemma safetensors conversion (#3250) hace 1 año
  Patrick Devine 1b272d5bcd change `github.com/jmorganca/ollama` to `github.com/ollama/ollama` (#3347) hace 1 año
  Michael Yang 22f326464e Merge pull request #3083 from ollama/mxyng/refactor-readseeker hace 1 año
  Blake Mizerany 6ce37e4d96 llm,readline: use errors.Is instead of simple == check (#3161) hace 1 año
  Michael Yang 0085297928 refactor readseeker hace 1 año
  Michael Yang 76bdebbadf decode ggla hace 1 año
  Patrick Devine 2c017ca441 Convert Safetensors to an Ollama model (#2824) hace 1 año
  Michael Yang 949d7b1c48 add gguf file types (#2532) hace 1 año
  Michael Yang cd22855ef8 refactor tensor read hace 1 año
  Michael Yang eaed6f8c45 add max context length check hace 1 año
  Jeffrey Morgan 08f1e18965 Offload layers to GPU based on new model size estimates (#1850) hace 1 año
  Michael Yang 56ffc3023a remove per-model types hace 1 año
  Michael Yang 5a5dca13b2 comments hace 1 año
  Michael Yang 72e7a49aa9 seek instead of copyn hace 1 año
  Michael Yang 2cb0fa7d40 split from into one or more models hace 1 año
  Michael Yang 199941cd15 fix: gguf int type hace 1 año
  Michael Yang c5e1bbabda instead of static number of parameters for each model family, get the real number from the tensors (#1022) hace 1 año
  Michael Yang 125d0a013a ggufv3 hace 1 año
  Michael Yang c02c0cd483 starcoder hace 1 año
  Bruce MacDonald 86279f4ae3 unbound max num gpu layers (#591) hace 1 año
  Bruce MacDonald 4cba75efc5 remove tmp directories created by previous servers (#559) hace 1 año
  Bruce MacDonald 66003e1d05 subprocess improvements (#524) hace 1 año
  Bruce MacDonald 2540c9181c support for packaging in multiple cuda runners (#509) hace 1 año