Jeffrey Morgan
|
e093db92c4
sample: temporarily use grammars for constrained generation in new engine (#9586)
|
1 tháng trước cách đây |
Michael Yang
|
05a01fdecb
ml/backend/ggml: consolidate system info logging
|
2 tháng trước cách đây |
Michael Yang
|
657685e85d
fix: replace deprecated functions
|
2 tháng trước cách đây |
Michael Yang
|
a59f665235
ml/backend/ggml: fix debug logging
|
2 tháng trước cách đây |
Jeffrey Morgan
|
d7d7e99662
llama: update llama.cpp vendor code to commit d7cfe1ff (#9356)
|
2 tháng trước cách đây |
Diego Pereira
|
928911bc68
runner: avoid buffer overwrite when generating multiple embeddings (#8714)
|
2 tháng trước cách đây |
Michael Yang
|
548a9f56a6
Revert "cgo: use O3"
|
3 tháng trước cách đây |
Michael Yang
|
bea1f1fac6
cgo: use O3
|
3 tháng trước cách đây |
Michael Yang
|
dcfb7a105c
next build (#8539)
|
3 tháng trước cách đây |
Jeffrey Morgan
|
1deafd8254
llama: update vendored code to commit 46e3556 (#8308)
|
3 tháng trước cách đây |
Daniel Hiltgen
|
60f75560a2
runner: switch logging back to stderr (#8091)
|
4 tháng trước cách đây |
Blake Mizerany
|
9039c821a2
llama: preserve field order in user-defined JSON schemas (#8002)
|
4 tháng trước cách đây |
Jeffrey Morgan
|
527cc97899
llama: update vendored code to commit 40c6d79f (#7875)
|
4 tháng trước cách đây |
Daniel Hiltgen
|
b9ccb3741e
Remove unused runner CpuFeatures (#8032)
|
4 tháng trước cách đây |
Daniel Hiltgen
|
4879a234c4
build: Make target improvements (#7499)
|
4 tháng trước cách đây |
Parth Sareen
|
630e7dc6ff
api: structured outputs - chat endpoint (#7900)
|
4 tháng trước cách đây |
Sam
|
1bdab9fdb1
llm: introduce k/v context quantization (vRAM improvements) (#6279)
|
4 tháng trước cách đây |
Jesse Gross
|
7121dfa309
runner.go: Retry decoding after defragmentation if needed
|
5 tháng trước cách đây |
Gabe Goodhart
|
807ace5b1f
fix(runner): Set logits to 0 if false on Batch.Add
|
5 tháng trước cách đây |
Michael Yang
|
549c2bdfcf
Merge pull request #7657 from ollama/mxyng/sync
|
5 tháng trước cách đây |
Michael Yang
|
5b3393b6a2
fix(mllama): sync backend between batches
|
5 tháng trước cách đây |
Daniel Hiltgen
|
df011054fa
Jetpack support for Go server (#7217)
|
5 tháng trước cách đây |
Jesse Gross
|
312d9de1d1
llama: Improve error handling
|
6 tháng trước cách đây |
Jesse Gross
|
a103dae01e
runner.go: Only allocate 1 element embedding batches for mllama
|
6 tháng trước cách đây |
Jesse Gross
|
c826e57475
runner.go: Better abstract vision model integration
|
6 tháng trước cách đây |
Daniel Hiltgen
|
712e99d477
Soften windows clang requirement (#7428)
|
6 tháng trước cách đây |
Daniel Hiltgen
|
b754f5a6a3
Remove submodule and shift to Go server - 0.4.0 (#7157)
|
6 tháng trước cách đây |
Jesse Gross
|
de1557a0dc
runner.go: Better handle return NULL values from llama.cpp
|
6 tháng trước cách đây |
Daniel Hiltgen
|
3085c47bea
Improve dependency gathering logic (#7345)
|
6 tháng trước cách đây |
Patrick Devine
|
c7cb0f0602
image processing for llama3.2 (#6963)
|
6 tháng trước cách đây |