Historial de Commits

Autor SHA1 Mensaje Fecha
  Parth Sareen b816ff86c9 docs: make context length faq readable (#10006) hace 1 mes
  molbal e5d84fb90b docs: add molbal/orca-cli to community integrations (#9909) hace 1 mes
  Hengky Steen dd66712e31 docs: add ollamb to community projects hace 1 mes
  Jesse Gross f66216e399 ggml: Support heterogeneous KV cache layer sizes in memory estimation hace 1 mes
  Jesse Gross f4f0992b6e llm: Fix debug logging for memory estimates hace 1 mes
  Jesse Gross 1feff61977 kvcache: Sliding window cache only needs a single batch total hace 1 mes
  copeland3300 5e0b904e88 docs: add flags to example linux log output command (#9852) hace 1 mes
  Matheus C. França 131f0355a5 readme: add ollama-d library (#9907) hace 1 mes
  Blake Mizerany ce929984a3 server/internal/client/ollama: fix file descriptor management in Pull (#9931) hace 1 mes
  Michael Yang 4b34930a31 Merge pull request #9897 from ollama/mxyng/chunk-load hace 1 mes
  Michael Yang 74bd09652d ml/backend/ggml: load tensors in 32KiB chunks hace 1 mes
  Bruce MacDonald fb6252d786 benchmark: performance of running ollama server (#8643) hace 1 mes
  Blake Mizerany c794fef2f2 server/internal/client/ollama: persist through chunk download errors (#9923) hace 1 mes
  Parth Sareen 00ebda8cc4 Revert "parser: remove role validation from Modelfile parser" (#9917) hace 1 mes
  Parth Sareen d14ce75b95 docs: update final response for /api/chat stream (#9919) hace 1 mes
  Jesse Gross 2d6eac9084 kvcache: Optimize sliding window attention hace 1 mes
  Jesse Gross 3ed7ad3ab3 kvcache: Pass granular cache size into implementations hace 1 mes
  Patrick Devine 6d1103048e fix: show correct bool value for kv in verbose show information (#9928) hace 1 mes
  Jesse Gross 0ff28758b3 ollamarunner: Provide mechanism for backends to report loading progress hace 1 mes
  Jesse Gross d3e9ca3eda kvcache: Account for source tensors in defrag operation count hace 1 mes
  Jesse Gross 0fbfcf3c9c model: Pass input tensor instead of raw data to models hace 1 mes
  Jesse Gross 0c220935bd input: Rename Options to Batch hace 1 mes
  rylativity ffbfe833da parser: remove role validation from Modelfile parser (#9874) hace 1 mes
  Parth Sareen 42a14f7f63 sample: add error handling for empty logits (#9740) hace 1 mes
  Patrick Devine f8c3dbe5b5 templates: add autotemplate for gemma3 (#9880) hace 1 mes
  Jesse Gross b078dd157c gemma2: Remove second call to Rows hace 1 mes
  Blake Mizerany 2ddacd7516 server/internal/client/ollama: confirm all chunksums were received (#9893) hace 1 mes
  Jeffrey Morgan da0e345200 ml: use input context for extracting outputs (#9875) hace 1 mes
  Bruce MacDonald df94175a0f ggml: return error on failure to read tensor data (#9872) hace 1 mes
  Bruce MacDonald 61a8825216 convert: return name of unsupported architecture (#9862) hace 1 mes