Bruce MacDonald
|
938be81c45
Add TODO
|
11 ヶ月 前 |
Bruce MacDonald
|
19ce10e49e
add a /tokenize endpoint
|
1 年間 前 |
Michael Yang
|
e03637176d
fix(routes): skip bad manifests
|
11 ヶ月 前 |
Daniel Hiltgen
|
3ae2f441e0
Fix race in shutdown logic
|
11 ヶ月 前 |
Daniel Hiltgen
|
8727a9c140
Record more GPU information
|
1 年間 前 |
Bruce MacDonald
|
cfa84b8470
add done_reason to the api (#4235)
|
11 ヶ月 前 |
Michael Yang
|
a7ee84fc31
routes: skip invalid filepaths
|
11 ヶ月 前 |
Jeffrey Morgan
|
d5eec16d23
use model defaults for `num_gqa`, `rope_frequency_base ` and `rope_frequency_scale` (#1983)
|
11 ヶ月 前 |
Bruce MacDonald
|
cef45feaa4
Add preflight OPTIONS handling and update CORS config (#4086)
|
1 年間 前 |
Bruce MacDonald
|
8cbd3e7510
skip hidden files in list models handler (#4247)
|
1 年間 前 |
Bruce MacDonald
|
dc9b1111e0
fix invalid destination error message
|
1 年間 前 |
Michael Yang
|
ffbd3d173f
Merge pull request #3715 from ollama/mxyng/modelname-2
|
1 年間 前 |
Michael Yang
|
1e0a669f75
Merge pull request #3682 from ollama/mxyng/quantize-all-the-things
|
1 年間 前 |
Michael Yang
|
548a7df014
update list handler to use model.Name
|
1 年間 前 |
Jeffrey Morgan
|
39d9d22ca3
close server on receiving signal (#4213)
|
1 年間 前 |
Michael Yang
|
9685c34509
quantize any fp16/fp32 model
|
1 年間 前 |
Daniel Hiltgen
|
f56aa20014
Centralize server config handling
|
1 年間 前 |
Daniel Hiltgen
|
20f6c06569
Make maximum pending request configurable
|
1 年間 前 |
Michael Yang
|
b7a87a22b6
Merge pull request #4059 from ollama/mxyng/parser-2
|
1 年間 前 |
Michael Yang
|
e9ae607ece
Merge pull request #3892 from ollama/mxyng/parser
|
1 年間 前 |
Michael Yang
|
45b6a12e45
server: target invalid
|
1 年間 前 |
Michael Yang
|
119589fcb3
rename parser to model/file
|
1 年間 前 |
Michael Yang
|
9cf0f2e973
use parser.Format instead of templating modelfile
|
1 年間 前 |
Jeffrey Morgan
|
bb31def011
return code `499` when user cancels request while a model is loading (#3955)
|
1 年間 前 |
Michael Yang
|
592dae31c8
update copy to use model.Name
|
1 年間 前 |
Daniel Hiltgen
|
34b9db5afc
Request and model concurrency
|
1 年間 前 |
Jeffrey Morgan
|
a0b8a32eb4
Terminate subprocess if receiving `SIGINT` or `SIGTERM` signals while model is loading (#3653)
|
1 年間 前 |
Michael Yang
|
9502e5661f
cgo quantize
|
1 年間 前 |
Michael Yang
|
e1c9a2a00f
no blob create if already exists
|
1 年間 前 |
Daniel Hiltgen
|
6589eb8a8c
Revert options as a ref in the server
|
1 年間 前 |