Jesse Gross
|
f66216e399
ggml: Support heterogeneous KV cache layer sizes in memory estimation
|
1 miesiąc temu |
Michael Yang
|
4ea4d2b189
Merge pull request #9703 from ollama/mxyng/gemma3-memory
|
1 miesiąc temu |
Michael Yang
|
8d76fa23ef
count non-repeating vision layers
|
1 miesiąc temu |
Michael Yang
|
65b88c544f
fix divide by zero
|
1 miesiąc temu |
Michael Yang
|
a422ba39c9
roughly count gemma3 graph
|
1 miesiąc temu |
Michael Yang
|
d2ec22371e
count all vision tensors
|
1 miesiąc temu |
Michael Yang
|
033cec232a
count gemma3 vision tensors
|
1 miesiąc temu |
Patrick Devine
|
4bed739259
add verbose mode to the show command (#9640)
|
1 miesiąc temu |
Daniel Hiltgen
|
ab39e08eb9
llm: auto detect models that require Ollama Engine (#1)
|
1 miesiąc temu |
Patrick Devine
|
5f74d1fd47
gemma2 impl
|
2 miesięcy temu |
Daniel Hiltgen
|
1fdb351c37
New engine: vision models and auto-fallback (#9113)
|
1 miesiąc temu |
Michael Yang
|
53d2990d9b
model: add bos token if configured
|
2 miesięcy temu |
Michael Yang
|
b16367b4b2
fix: add back bf16 support
|
2 miesięcy temu |
Michael Yang
|
58245413f4
next ollama runner (#7913)
|
2 miesięcy temu |