Michael Yang
|
f2074ed4c0
Merge pull request #306 from jmorganca/default-keep-system
|
пре 1 година |
Bruce MacDonald
|
a6f6d18f83
embed text document in modelfile
|
пре 1 година |
Jeffrey Morgan
|
5eb712f962
trim whitespace before checking stop conditions
|
пре 1 година |
Michael Yang
|
4dc5b117dd
automatically set num_keep if num_keep < 0
|
пре 1 година |
Michael Yang
|
b9f4d67554
configurable rope frequency parameters
|
пре 1 година |
Michael Yang
|
c5bcf32823
update llama.cpp
|
пре 1 година |
Michael Yang
|
74a5f7e698
no gpu for 70B model
|
пре 1 година |
Michael Yang
|
319f078dd9
remove -Werror
|
пре 1 година |
Jeffrey Morgan
|
7da249fcc1
only build metal for `darwin,arm` target
|
пре 1 година |
Bruce MacDonald
|
184ad8f057
allow specifying stop conditions in modelfile
|
пре 1 година |
Michael Yang
|
3549676678
embed ggml-metal.metal
|
пре 1 година |
Michael Yang
|
fadf75f99d
add stop conditions
|
пре 1 година |
Michael Yang
|
ad3a7d0e2c
add NumGQA
|
пре 1 година |
Michael Yang
|
cca61181cb
sample metrics
|
пре 1 година |
Michael Yang
|
c490416189
lock on llm.lock(); decrease batch size
|
пре 1 година |
Michael Yang
|
f62a882760
add session expiration
|
пре 1 година |
Michael Yang
|
3003fc03fc
update predict code
|
пре 1 година |
Michael Yang
|
35af37a2cb
session id
|
пре 1 година |
Michael Yang
|
726bc647b2
enable k quants
|
пре 1 година |
Michael Yang
|
cb55fa9270
enable accelerate
|
пре 1 година |
Michael Yang
|
b71c67b6ba
allocate a large enough tokens slice
|
пре 1 година |
Michael Yang
|
40c9dc0a31
fix multibyte responses
|
пре 1 година |
Michael Yang
|
0142660bd4
size_t
|
пре 1 година |
Michael Yang
|
1775647f76
continue conversation
|
пре 1 година |
Michael Yang
|
05e08d2310
return more info in generate response
|
пре 1 година |
Michael Yang
|
e1f0a0dc74
fix eof error in generate
|
пре 1 година |
Jeffrey Morgan
|
c63f811909
return error if model fails to load
|
пре 1 година |
Michael Yang
|
442dec1c6f
vendor llama.cpp
|
пре 1 година |
Michael Yang
|
fd4792ec56
call llama.cpp directly from go
|
пре 1 година |
Jeffrey Morgan
|
5fb96255dc
llama: remove unused helper functions
|
пре 1 година |