Blake Mizerany
|
cb42e607c5
llm: speed up gguf decoding by a lot (#5246)
|
hace 10 meses |
Michael Yang
|
c16f8af911
fix: multiple templates when creating from model
|
hace 10 meses |
Michael Yang
|
d61ef8b954
update create handler to use model.Name
|
hace 1 año |
Michael Yang
|
e40145a39d
lint
|
hace 11 meses |
Michael Yang
|
f36f1d6be9
tidy intermediate blobs
|
hace 11 meses |
Michael Yang
|
3520c0e4d5
cache and reuse intermediate blobs
|
hace 11 meses |
Michael Yang
|
b2f00aa977
close zip files
|
hace 1 año |
Michael Yang
|
f5e8b207fb
s/DisplayLongest/String/
|
hace 1 año |
Michael Yang
|
4d0d0fa383
no iterator
|
hace 1 año |
Michael Yang
|
01811c176a
comments
|
hace 1 año |
Michael Yang
|
9685c34509
quantize any fp16/fp32 model
|
hace 1 año |