Daniel Hiltgen
|
ccd7785859
Merge pull request #5243 from dhiltgen/modelfile_use_mmap
|
10 kuukautta sitten |
royjhan
|
996bb1b85e
OpenAI: /v1/models and /v1/models/{model} compatibility (#5007)
|
10 kuukautta sitten |
Daniel Hiltgen
|
97c9e11768
Switch use_mmap to a pointer type
|
10 kuukautta sitten |
Daniel Hiltgen
|
7e7749224c
Fix use_mmap parsing for modelfiles
|
10 kuukautta sitten |
royjhan
|
fedf71635e
Extend api/show and ollama show to return more model info (#4881)
|
10 kuukautta sitten |
Daniel Hiltgen
|
171796791f
Adjust mmap logic for cuda windows for faster model load
|
10 kuukautta sitten |
royjhan
|
89c79bec8c
Add ModifiedAt Field to /api/show (#5033)
|
10 kuukautta sitten |
Patrick Devine
|
c69bc19e46
move OLLAMA_HOST to envconfig (#5009)
|
10 kuukautta sitten |
royjhan
|
4bf1da4944
Separate ListResponse and ModelResponse for api/tags vs api/ps (#4842)
|
11 kuukautta sitten |
Michael Yang
|
c895a7d13f
some gocritic
|
11 kuukautta sitten |
Patrick Devine
|
6845988807
Ollama `ps` command for showing currently loaded models (#4327)
|
11 kuukautta sitten |
Jeffrey Morgan
|
6602e793c0
Use `--quantize` flag and `quantize` api parameter (#4321)
|
11 kuukautta sitten |
Bruce MacDonald
|
c02db93243
omit empty done reason
|
11 kuukautta sitten |
Bruce MacDonald
|
cfa84b8470
add done_reason to the api (#4235)
|
11 kuukautta sitten |
Jeffrey Morgan
|
d5eec16d23
use model defaults for `num_gqa`, `rope_frequency_base ` and `rope_frequency_scale` (#1983)
|
11 kuukautta sitten |
Eli Bendersky
|
d77c1c5f9d
api: fill up API documentation (#3596)
|
1 vuosi sitten |
Jackie Li
|
af47413dba
Add MarshalJSON to Duration (#3284)
|
1 vuosi sitten |
Patrick Devine
|
9009bedf13
better checking for OLLAMA_HOST variable (#3661)
|
1 vuosi sitten |
Jeffrey Morgan
|
993cf8bf55
llm: limit generation to 10x context size to avoid run on generations (#3918)
|
1 vuosi sitten |
Cheng
|
62be2050dd
chore: use errors.New to replace fmt.Errorf will much better (#3789)
|
1 vuosi sitten |
Eli Bendersky
|
ad90b9ab3d
api: start adding documentation to package api (#2878)
|
1 vuosi sitten |
Michael Yang
|
01114b4526
fix: rope
|
1 vuosi sitten |
Michael Yang
|
9502e5661f
cgo quantize
|
1 vuosi sitten |
Michael Yang
|
be517e491c
no rope parameters
|
1 vuosi sitten |
Jeffrey Morgan
|
3b4bab3dc5
Fix embeddings load model behavior (#2848)
|
1 vuosi sitten |
Ikko Eltociear Ashimine
|
e95b896790
Update types.go (#2744)
|
1 vuosi sitten |
bnorick
|
caf2b13c10
Fix infinite keep_alive (#2480)
|
1 vuosi sitten |
Patrick Devine
|
b5cf31b460
add keep_alive to generate/chat/embedding api endpoints (#2146)
|
1 vuosi sitten |
Patrick Devine
|
7c40a67841
Save and load sessions (#2063)
|
1 vuosi sitten |
Michael Yang
|
745b5934fa
add model to ModelResponse
|
1 vuosi sitten |