Daniel Hiltgen
|
e9ce91e9a6
Load dynamic cpu lib on windows
|
1 yıl önce |
Jeffrey Morgan
|
c0285158a9
tweak memory requirements error text
|
1 yıl önce |
Jeffrey Morgan
|
77a66df72c
add macOS memory check for 47B models
|
1 yıl önce |
Jeffrey Morgan
|
5b4837f881
remove unused filetype check
|
1 yıl önce |
Daniel Hiltgen
|
7555ea44f8
Revamp the dynamic library shim
|
1 yıl önce |
Daniel Hiltgen
|
3269535a4c
Refine handling of shim presence
|
1 yıl önce |
Daniel Hiltgen
|
35934b2e05
Adapted rocm support to cgo based llama.cpp
|
1 yıl önce |
Daniel Hiltgen
|
d4cd695759
Add cgo implementation for llama.cpp
|
1 yıl önce |
Bruce MacDonald
|
811b1f03c8
deprecate ggml
|
1 yıl önce |
Michael Yang
|
b9495ea162
load projectors
|
1 yıl önce |
Bruce MacDonald
|
195e3d9dbd
chat api endpoint (#1392)
|
1 yıl önce |
Jeffrey Morgan
|
00d06619a1
Revert "chat api (#991)" while context variable is fixed
|
1 yıl önce |
Bruce MacDonald
|
7a0899d62d
chat api (#991)
|
1 yıl önce |
Michael Yang
|
19b7a4d715
recent llama.cpp update added kernels for fp32, q5_0, and q5_1
|
1 yıl önce |
Jeffrey Morgan
|
5cba29b9d6
JSON mode: add `"format" as an api parameter (#1051)
|
1 yıl önce |
Jeffrey Morgan
|
2e53704685
default rope params to 0 for new models (#968)
|
1 yıl önce |
Jeffrey Morgan
|
7ed5a39bc7
simpler check for model loading compatibility errors
|
1 yıl önce |
Jeffrey Morgan
|
a7dad24d92
add error for `falcon` and `starcoder` vocab compatibility (#844)
|
1 yıl önce |
Michael Yang
|
36fe2deebf
only check system memory on macos
|
1 yıl önce |
Michael Yang
|
4a8931f634
check total (system + video) memory
|
1 yıl önce |
Michael Yang
|
bd6e38fb1a
refactor memory check
|
1 yıl önce |
Michael Yang
|
92189a5855
fix memory check
|
1 yıl önce |
Michael Yang
|
b599946b74
add format bytes
|
1 yıl önce |
Bruce MacDonald
|
d06bc0cb6e
enable q8, q5, 5_1, and f32 for linux gpu (#699)
|
1 yıl önce |
Bruce MacDonald
|
86279f4ae3
unbound max num gpu layers (#591)
|
1 yıl önce |
Bruce MacDonald
|
4cba75efc5
remove tmp directories created by previous servers (#559)
|
1 yıl önce |
Michael Yang
|
7dee25a07f
fix falcon decode
|
1 yıl önce |
Bruce MacDonald
|
09dd2aeff9
GGUF support (#441)
|
1 yıl önce |
Bruce MacDonald
|
42998d797d
subprocess llama.cpp server (#401)
|
1 yıl önce |
Michael Yang
|
b25dd1795d
allow F16 to use metal
|
1 yıl önce |