Commit Verlauf

Autor SHA1 Nachricht Datum
  Michael Yang 4a33cede20 remove unused fields and functions vor 1 Jahr
  Jeffrey Morgan 08f1e18965 Offload layers to GPU based on new model size estimates (#1850) vor 1 Jahr
  Bruce MacDonald 0b3118e0af fix: relay request opts to loaded llm prediction (#1761) vor 1 Jahr
  Daniel Hiltgen d966b730ac Switch windows build to fully dynamic vor 1 Jahr
  Daniel Hiltgen 7555ea44f8 Revamp the dynamic library shim vor 1 Jahr
  Daniel Hiltgen 54dbfa4c4a Carry ggml-metal.metal as payload vor 1 Jahr
  Daniel Hiltgen 35934b2e05 Adapted rocm support to cgo based llama.cpp vor 1 Jahr
  Daniel Hiltgen d4cd695759 Add cgo implementation for llama.cpp vor 1 Jahr
  Bruce MacDonald 811b1f03c8 deprecate ggml vor 1 Jahr
  Bruce MacDonald 6ee8c80199 restore model load duration on generate response (#1524) vor 1 Jahr
  Bruce MacDonald 3144e2a439 exponential back-off (#1484) vor 1 Jahr
  Bruce MacDonald c0960e29b5 retry on concurrent request failure (#1483) vor 1 Jahr
  Patrick Devine 910e9401d0 Multimodal support (#1216) vor 1 Jahr
  Jeffrey Morgan fa2f095bd9 fix model name returned by `/api/generate` being different than the model name provided vor 1 Jahr
  Jeffrey Morgan 2dd040d04c do not use `--parallel 2` for old runners vor 1 Jahr
  Bruce MacDonald bbe41ce41a fix: parallel queueing race condition caused silent failure (#1445) vor 1 Jahr
  Michael Yang b9495ea162 load projectors vor 1 Jahr
  Bruce MacDonald 195e3d9dbd chat api endpoint (#1392) vor 1 Jahr
  Jeffrey Morgan 00d06619a1 Revert "chat api (#991)" while context variable is fixed vor 1 Jahr
  Bruce MacDonald 7a0899d62d chat api (#991) vor 1 Jahr
  Jing Zhang 82b9b329ff windows CUDA support (#1262) vor 1 Jahr
  Jeffrey Morgan a3fcecf943 only set `main_gpu` if value > 0 is provided vor 1 Jahr
  Purinda Gunasekara be61a81758 main-gpu argument is not getting passed to llamacpp, fixed. (#1192) vor 1 Jahr
  Jeffrey Morgan 36a3bbf65f Update llm/llama.go vor 1 Jahr
  Bruce MacDonald 43a726149d fix potentially inaccurate error message vor 1 Jahr
  Jeffrey Morgan 41434a7cdc build intel mac with correct binary and compile flags vor 1 Jahr
  Jeffrey Morgan 5cba29b9d6 JSON mode: add `"format" as an api parameter (#1051) vor 1 Jahr
  Bruce MacDonald 1ae84bc2a2 skip gpu if less than 2GB VRAM are available (#1059) vor 1 Jahr
  Jeffrey Morgan c44b619428 remove unused `fmt.Println` vor 1 Jahr
  Jeffrey Morgan 17678b7225 Restore system prompt on requests and default `num_keep` to `0` vor 1 Jahr