Michael Yang
|
9d91e5e587
remove confusing log message
|
10 месяцев назад |
Daniel Hiltgen
|
fb9cdfa723
Fix server.cpp for the new cuda build macros
|
11 месяцев назад |
Jeffrey Morgan
|
ead259d877
llm: fix seed value not being applied to requests (#4986)
|
10 месяцев назад |
Jeffrey Morgan
|
34f142797a
llm: always add bos token to prompt (#4941)
|
10 месяцев назад |
Michael Yang
|
829ff87bd1
revert tokenize ffi (#4761)
|
11 месяцев назад |
Michael Yang
|
de781b37c8
rm unused infill
|
11 месяцев назад |
Michael Yang
|
3e21799377
rm unused system prompt
|
11 месяцев назад |
Michael Yang
|
26a00a0410
use ffi for tokenizing/detokenizing
|
11 месяцев назад |
Michael Yang
|
714adb8bd1
bump (#4597)
|
11 месяцев назад |
Daniel Hiltgen
|
b37b496a12
Wire up load progress
|
11 месяцев назад |
Sam
|
e15307fdf4
feat: add support for flash_attn (#4120)
|
11 месяцев назад |
Michael Yang
|
58876091f7
log clean up
|
11 месяцев назад |
Daniel Hiltgen
|
920a4b0794
Merge remote-tracking branch 'upstream/main' into pr3702
|
1 год назад |
Michael Yang
|
44869c59d6
omit prompt and generate settings from final response
|
1 год назад |
jmorganca
|
fcf4d60eee
llm: add back check for empty token cache
|
1 год назад |
Jeffrey Morgan
|
18d9a7e1f1
update llama.cpp submodule to `f364eb6` (#4060)
|
1 год назад |
Daniel Hiltgen
|
23d23409a0
Update llama.cpp (#4036)
|
1 год назад |
ManniX-ITA
|
c942e4a07b
Fixed startup sequence to report model loading
|
1 год назад |
Jeffrey Morgan
|
7c9792a6e0
Support unicode characters in model path (#3681)
|
1 год назад |
Daniel Hiltgen
|
0a0e9f3e0f
Apply 01-cache.diff
|
1 год назад |
Daniel Hiltgen
|
58d95cc9bd
Switch back to subprocessing for llama.cpp
|
1 год назад |
Jeffrey Morgan
|
f5ca7f8c8e
add license in file header for vendored llama.cpp code (#3351)
|
1 год назад |
Daniel Hiltgen
|
43799532c1
Bump llama.cpp to b2474
|
1 год назад |
Jeffrey Morgan
|
e95ffc7448
llama: remove server static assets (#3174)
|
1 год назад |
Daniel Hiltgen
|
85129d3a32
Adapt our build for imported server.cpp
|
1 год назад |
Daniel Hiltgen
|
9ac6440da3
Import server.cpp as of b2356
|
1 год назад |