Commit Verlauf

Autor SHA1 Nachricht Datum
  Jeffrey Morgan 15c2d8fe14 server: parallelize embeddings in API web handler instead of in subprocess runner (#6220) vor 9 Monaten
  Daniel Hiltgen 25906d72d1 llm: prevent loading too large models on windows (#5926) vor 9 Monaten
  Jeffrey Morgan de4fc29773 llm: reserve required number of slots for embeddings (#6219) vor 9 Monaten
  Daniel Hiltgen f457d63400 Implement linux NUMA detection vor 9 Monaten
  Michael Yang b732beba6a lint vor 9 Monaten
  Michael Yang 5c1912769e Merge pull request #5473 from ollama/mxyng/environ vor 9 Monaten
  royjhan 1b44d873e7 Add Metrics to `api\embed` response (#5709) vor 9 Monaten
  Tibor Schmidt f3d7a481b7 feat: add support for min_p (resolve #1142) (#1825) vor 9 Monaten
  Daniel Hiltgen e12fff8810 Enable windows error dialog for subprocess startup vor 10 Monaten
  Michael Yang e2c3f6b3e2 string vor 10 Monaten
  Michael Yang 55cd3ddcca bool vor 10 Monaten
  Michael Yang 35b89b2eab rfc: dynamic environ lookup vor 10 Monaten
  Daniel Hiltgen a3c20e3f18 Refine error reporting for subprocess crash vor 9 Monaten
  Daniel Hiltgen 283948c83b Adjust windows ROCm discovery vor 9 Monaten
  royjhan b9f5e16c80 Introduce `/api/embed` endpoint supporting batch embedding (#5127) vor 10 Monaten
  Jeffrey Morgan ef98803d63 llm: looser checks for minimum memory (#5677) vor 10 Monaten
  Jeffrey Morgan c4cf8ad559 llm: avoid loading model if system memory is too small (#5637) vor 10 Monaten
  Jeffrey Morgan 791650ddef sched: only error when over-allocating system memory (#5626) vor 10 Monaten
  Daniel Hiltgen 22c81f62ec Remove duplicate merge glitch vor 10 Monaten
  Michael Yang 9bbddc37a7 Merge pull request #5126 from ollama/mxyng/messages vor 10 Monaten
  Jeffrey Morgan 53da2c6965 llm: remove ambiguous comment when putting upper limit on predictions to avoid infinite generation (#5535) vor 10 Monaten
  Michael Yang ac7a842e55 fix model reloading vor 10 Monaten
  Daniel Hiltgen ccd7785859 Merge pull request #5243 from dhiltgen/modelfile_use_mmap vor 10 Monaten
  Daniel Hiltgen 0e982bc1f4 Fix corner cases on tmp cleaner on mac vor 10 Monaten
  Josh Yan 33a65e3ba3 error vor 10 Monaten
  Daniel Hiltgen 97c9e11768 Switch use_mmap to a pointer type vor 10 Monaten
  Daniel Hiltgen 3518aaef33 Merge pull request #4218 from dhiltgen/auto_parallel vor 10 Monaten
  Blake Mizerany cb42e607c5 llm: speed up gguf decoding by a lot (#5246) vor 10 Monaten
  Daniel Hiltgen 17b7186cd7 Enable concurrency by default vor 1 Jahr
  Daniel Hiltgen 5bf5aeec01 Refine mmap default logic on linux vor 10 Monaten