Jesse Gross
|
b70fc4d51e
model: Don't unconditionally add special tokens
|
1 månad sedan |
Daniel Hiltgen
|
1fdb351c37
New engine: vision models and auto-fallback (#9113)
|
1 månad sedan |
Jeffrey Morgan
|
5296f487a8
llm: attempt to evaluate symlinks, but do not fail (#9089)
|
2 månader sedan |
Jeffrey Morgan
|
f05774b04c
llm: do not evaluate symlink for exe path lookup (#9088)
|
2 månader sedan |
Jesse Gross
|
ed443a0393
Runner for Ollama engine
|
4 månader sedan |
Michael Yang
|
58245413f4
next ollama runner (#7913)
|
2 månader sedan |
Jeffrey Morgan
|
4759ecae19
ml/backend/ggml: fix library loading on macOS amd64 (#8827)
|
2 månader sedan |
Jeffrey Morgan
|
50566113ac
llm: do not error if LibOllamaPath does not exist (#8801)
|
2 månader sedan |
Michael Yang
|
dcfb7a105c
next build (#8539)
|
3 månader sedan |
Jeffrey Morgan
|
1deafd8254
llama: update vendored code to commit 46e3556 (#8308)
|
3 månader sedan |
Blake Mizerany
|
2ddc32d5c5
llm: do not error on "null" format (#8139)
|
4 månader sedan |
Blake Mizerany
|
87f0a49fe6
llm: do not silently fail for supplied, but invalid formats (#8130)
|
4 månader sedan |
Jeffrey Morgan
|
0f06a6daa7
llm: loosen format check to default to no format (#8127)
|
4 månader sedan |
Blake Mizerany
|
9039c821a2
llama: preserve field order in user-defined JSON schemas (#8002)
|
4 månader sedan |
Jeffrey Morgan
|
527cc97899
llama: update vendored code to commit 40c6d79f (#7875)
|
4 månader sedan |
Daniel Hiltgen
|
4879a234c4
build: Make target improvements (#7499)
|
4 månader sedan |
Parth Sareen
|
de52b6c2f9
bugfix: "null" value json mode (#7979)
|
4 månader sedan |
Parth Sareen
|
630e7dc6ff
api: structured outputs - chat endpoint (#7900)
|
4 månader sedan |
Sam
|
539be43640
llm: normalise kvct parameter handling (#7926)
|
5 månader sedan |
Sam
|
1bdab9fdb1
llm: introduce k/v context quantization (vRAM improvements) (#6279)
|
5 månader sedan |
ItzCrazyKns
|
e3936d4fb3
Support Multiple LoRa Adapters (#7667)
|
5 månader sedan |
Daniel Hiltgen
|
b85520bfb9
logs: explain client aborts better (#7783)
|
5 månader sedan |
Daniel Hiltgen
|
909a88c5c0
Improve crash reporting (#7728)
|
5 månader sedan |
Daniel Hiltgen
|
81d55d3e4d
fix index out of range on zero layer metal load (#7696)
|
5 månader sedan |
Daniel Hiltgen
|
df011054fa
Jetpack support for Go server (#7217)
|
5 månader sedan |
Jesse Gross
|
a909417602
runner.go: Remove unused arguments
|
6 månader sedan |
Jesse Gross
|
de1557a0dc
runner.go: Better handle return NULL values from llama.cpp
|
6 månader sedan |
Patrick Devine
|
c7cb0f0602
image processing for llama3.2 (#6963)
|
6 månader sedan |
Gabe Goodhart
|
f2890a4494
IBM granite/granitemoe architecture support (#6760)
|
6 månader sedan |
Daniel Hiltgen
|
05cd82ef94
Rename gpu package discover (#7143)
|
6 månader sedan |