Historie revizí

Autor SHA1 Zpráva Datum
  Jeffrey Morgan 527cc97899 llama: update vendored code to commit 40c6d79f (#7875) před 4 měsíci
  Daniel Hiltgen 4879a234c4 build: Make target improvements (#7499) před 4 měsíci
  Sam 1bdab9fdb1 llm: introduce k/v context quantization (vRAM improvements) (#6279) před 5 měsíci
  ItzCrazyKns e3936d4fb3 Support Multiple LoRa Adapters (#7667) před 5 měsíci
  Jesse Gross 71e6a0d0d1 runner.go: Don't try to extract image tags for text models před 5 měsíci
  Jesse Gross 2cd11ae365 runner.go: Add unit tests for context shifting před 5 měsíci
  Jesse Gross 3478b2cf14 runner.go: Fix deadlock with many concurrent requests před 5 měsíci
  Daniel Hiltgen b85520bfb9 logs: explain client aborts better (#7783) před 5 měsíci
  Jesse Gross c4b34f2a2a runner.go: Truncate inputs that exceed context rather than shifting před 5 měsíci
  Jesse Gross c3ff916431 runner.go: Don't add inputs to cache view until actually processed před 5 měsíci
  Jesse Gross 3fc1dc0e6f runner.go: Hard fail on errors rather than potentially infinite looping před 5 měsíci
  Jesse Gross 7121dfa309 runner.go: Retry decoding after defragmentation if needed před 5 měsíci
  Jesse Gross 5f68fcab12 runner.go: Use correct index when retrieving embedding results před 5 měsíci
  Jesse Gross d875e99e46 runner.go: Propagate panics back to the user. před 5 měsíci
  Jesse Gross 8a35bb926e runner.go: Increase survivability of main processing loop před 5 měsíci
  Jesse Gross c25ffde91d runner.go: Don't trim whitespace from inputs před 5 měsíci
  Jesse Gross 17b386a891 runner.go: Enforce NUM_PARALLEL directly in the runner před 5 měsíci
  Michael Yang 549c2bdfcf Merge pull request #7657 from ollama/mxyng/sync před 5 měsíci
  Michael Yang 5b3393b6a2 fix(mllama): sync backend between batches před 5 měsíci
  Jesse Gross d7eb05b936 runner.go: Fix off-by-one for num predicted před 5 měsíci
  Jesse Gross 65973ceb64 runner.go: Make KV entry accounting more robust před 5 měsíci
  Jesse Gross a909417602 runner.go: Remove unused arguments před 6 měsíci
  Jesse Gross 312d9de1d1 llama: Improve error handling před 6 měsíci
  Jesse Gross a103dae01e runner.go: Only allocate 1 element embedding batches for mllama před 6 měsíci
  Jesse Gross 26acdcf44e runner.go: Don't set cross attention before sending embeddings před 6 měsíci
  Jesse Gross c826e57475 runner.go: Better abstract vision model integration před 6 měsíci
  Daniel Hiltgen 712e99d477 Soften windows clang requirement (#7428) před 6 měsíci
  Jesse Gross de1557a0dc runner.go: Better handle return NULL values from llama.cpp před 6 měsíci
  Jesse Gross 03e40efa51 runner.go: Merge partial unicode characters before sending před 6 měsíci
  Patrick Devine c7cb0f0602 image processing for llama3.2 (#6963) před 6 měsíci