提交历史

作者 SHA1 备注 提交日期
  Daniel Hiltgen e9ce91e9a6 Load dynamic cpu lib on windows 1 年之前
  Jeffrey Morgan c0285158a9 tweak memory requirements error text 1 年之前
  Jeffrey Morgan 77a66df72c add macOS memory check for 47B models 1 年之前
  Jeffrey Morgan 5b4837f881 remove unused filetype check 1 年之前
  Daniel Hiltgen 7555ea44f8 Revamp the dynamic library shim 1 年之前
  Daniel Hiltgen 3269535a4c Refine handling of shim presence 1 年之前
  Daniel Hiltgen 35934b2e05 Adapted rocm support to cgo based llama.cpp 1 年之前
  Daniel Hiltgen d4cd695759 Add cgo implementation for llama.cpp 1 年之前
  Bruce MacDonald 811b1f03c8 deprecate ggml 1 年之前
  Michael Yang b9495ea162 load projectors 1 年之前
  Bruce MacDonald 195e3d9dbd chat api endpoint (#1392) 1 年之前
  Jeffrey Morgan 00d06619a1 Revert "chat api (#991)" while context variable is fixed 1 年之前
  Bruce MacDonald 7a0899d62d chat api (#991) 1 年之前
  Michael Yang 19b7a4d715 recent llama.cpp update added kernels for fp32, q5_0, and q5_1 1 年之前
  Jeffrey Morgan 5cba29b9d6 JSON mode: add `"format" as an api parameter (#1051) 1 年之前
  Jeffrey Morgan 2e53704685 default rope params to 0 for new models (#968) 1 年之前
  Jeffrey Morgan 7ed5a39bc7 simpler check for model loading compatibility errors 1 年之前
  Jeffrey Morgan a7dad24d92 add error for `falcon` and `starcoder` vocab compatibility (#844) 1 年之前
  Michael Yang 36fe2deebf only check system memory on macos 1 年之前
  Michael Yang 4a8931f634 check total (system + video) memory 1 年之前
  Michael Yang bd6e38fb1a refactor memory check 1 年之前
  Michael Yang 92189a5855 fix memory check 1 年之前
  Michael Yang b599946b74 add format bytes 1 年之前
  Bruce MacDonald d06bc0cb6e enable q8, q5, 5_1, and f32 for linux gpu (#699) 1 年之前
  Bruce MacDonald 86279f4ae3 unbound max num gpu layers (#591) 1 年之前
  Bruce MacDonald 4cba75efc5 remove tmp directories created by previous servers (#559) 1 年之前
  Michael Yang 7dee25a07f fix falcon decode 1 年之前
  Bruce MacDonald 09dd2aeff9 GGUF support (#441) 1 年之前
  Bruce MacDonald 42998d797d subprocess llama.cpp server (#401) 1 年之前
  Michael Yang b25dd1795d allow F16 to use metal 1 年之前