Michael Yang
|
7e33a017c0
partial offloading
|
1 jaar geleden |
Michael Yang
|
8b2c10061c
refactor tensor query
|
1 jaar geleden |
Daniel Hiltgen
|
c5ff443b9f
Handle very slow model loads
|
1 jaar geleden |
Michael Yang
|
be517e491c
no rope parameters
|
1 jaar geleden |
Michael Yang
|
12e923e158
update graph size estimate
|
1 jaar geleden |
Daniel Hiltgen
|
464d817824
Merge pull request #3464 from dhiltgen/subprocess
|
1 jaar geleden |
Daniel Hiltgen
|
6589eb8a8c
Revert options as a ref in the server
|
1 jaar geleden |
Michael Yang
|
80163ebcb5
fix metal gpu
|
1 jaar geleden |
Daniel Hiltgen
|
58d95cc9bd
Switch back to subprocessing for llama.cpp
|
1 jaar geleden |