Michael Yang
|
74a5f7e698
no gpu for 70B model
|
1 vuosi sitten |
Michael Yang
|
319f078dd9
remove -Werror
|
1 vuosi sitten |
Jeffrey Morgan
|
7da249fcc1
only build metal for `darwin,arm` target
|
1 vuosi sitten |
Bruce MacDonald
|
184ad8f057
allow specifying stop conditions in modelfile
|
1 vuosi sitten |
Michael Yang
|
3549676678
embed ggml-metal.metal
|
1 vuosi sitten |
Michael Yang
|
fadf75f99d
add stop conditions
|
1 vuosi sitten |
Michael Yang
|
ad3a7d0e2c
add NumGQA
|
1 vuosi sitten |
Michael Yang
|
cca61181cb
sample metrics
|
1 vuosi sitten |
Michael Yang
|
c490416189
lock on llm.lock(); decrease batch size
|
1 vuosi sitten |
Michael Yang
|
f62a882760
add session expiration
|
1 vuosi sitten |
Michael Yang
|
3003fc03fc
update predict code
|
1 vuosi sitten |
Michael Yang
|
35af37a2cb
session id
|
1 vuosi sitten |
Michael Yang
|
726bc647b2
enable k quants
|
1 vuosi sitten |
Michael Yang
|
cb55fa9270
enable accelerate
|
1 vuosi sitten |
Michael Yang
|
b71c67b6ba
allocate a large enough tokens slice
|
1 vuosi sitten |
Michael Yang
|
40c9dc0a31
fix multibyte responses
|
1 vuosi sitten |
Michael Yang
|
0142660bd4
size_t
|
1 vuosi sitten |
Michael Yang
|
1775647f76
continue conversation
|
1 vuosi sitten |
Michael Yang
|
05e08d2310
return more info in generate response
|
1 vuosi sitten |
Michael Yang
|
e1f0a0dc74
fix eof error in generate
|
1 vuosi sitten |
Jeffrey Morgan
|
c63f811909
return error if model fails to load
|
1 vuosi sitten |
Michael Yang
|
442dec1c6f
vendor llama.cpp
|
1 vuosi sitten |
Michael Yang
|
fd4792ec56
call llama.cpp directly from go
|
1 vuosi sitten |
Jeffrey Morgan
|
5fb96255dc
llama: remove unused helper functions
|
1 vuosi sitten |
Patrick Devine
|
3f1b7177f2
pass model and predict options
|
1 vuosi sitten |
Michael Yang
|
5dc9c8ff23
more free
|
1 vuosi sitten |
Bruce MacDonald
|
da74384a3e
remove prompt cache
|
1 vuosi sitten |
Michael Yang
|
2c80eddd71
more free
|
1 vuosi sitten |
Jeffrey Morgan
|
9fe018675f
use `Makefile` for dependency building instead of `go generate`
|
1 vuosi sitten |
Jeffrey Morgan
|
0998d4f0a4
remove debug print statements
|
1 vuosi sitten |