Michael Yang
|
74bd09652d
ml/backend/ggml: load tensors in 32KiB chunks
|
1 kuukausi sitten |
Jesse Gross
|
0ff28758b3
ollamarunner: Provide mechanism for backends to report loading progress
|
1 kuukausi sitten |
Michael Yang
|
63a394068c
use 2d pooling
|
1 kuukausi sitten |
Michael Yang
|
0df1800436
set non-causal attention
|
1 kuukausi sitten |
Michael Yang
|
4b037a97dc
add gemma vision encoder
|
1 kuukausi sitten |
Patrick Devine
|
5f74d1fd47
gemma2 impl
|
2 kuukautta sitten |
Michael Yang
|
9926eae015
fix: pad tensor item if ge zero
|
1 kuukausi sitten |
Jesse Gross
|
4100ed7bdd
ml: Add support for quantized KV cache
|
2 kuukautta sitten |
Michael Yang
|
7bae7fa5ce
ml/backend/ggml: create tensor on specific backend
|
2 kuukautta sitten |
Michael Yang
|
764e199d67
kvcache: create cache ctx per layer
|
2 kuukautta sitten |
Michael Yang
|
05a01fdecb
ml/backend/ggml: consolidate system info logging
|
2 kuukautta sitten |
Jesse Gross
|
21aa666a1e
ml: Enable support for flash attention
|
2 kuukautta sitten |
Jesse Gross
|
ee141cc821
ml: Empty tensor constructor for tensors
|
2 kuukautta sitten |
Jesse Gross
|
854a9195f3
attention: Remove unnecessary contiguous operations
|
2 kuukautta sitten |
Michael Yang
|
3e8b8a1933
ml: update Context.Forward interface
|
2 kuukautta sitten |
Michael Yang
|
53d2990d9b
model: add bos token if configured
|
2 kuukautta sitten |
Jesse Gross
|
f53f4198c3
ml: Abstract attention out of model definitions
|
2 kuukautta sitten |
Jesse Gross
|
bd6a7d5e64
ollamarunner: Pass runner performance parameters to backends
|
2 kuukautta sitten |
Daniel Hiltgen
|
df2680b4b9
Wire up system info log for new engine (#9123)
|
2 kuukautta sitten |
Jesse Gross
|
ed443a0393
Runner for Ollama engine
|
4 kuukautta sitten |
Jesse Gross
|
d773b7d671
backend: API to support full precision matmul
|
2 kuukautta sitten |
Jesse Gross
|
4d4463b2bd
backend: Support graph computation that does not return an output
|
2 kuukautta sitten |
Jesse Gross
|
0e38297f87
backend: Consistently use int (vs. int64) for tensor shapes
|
2 kuukautta sitten |
Jesse Gross
|
7e13f568dc
backend: Don't return an error on Close
|
2 kuukautta sitten |
Michael Yang
|
58245413f4
next ollama runner (#7913)
|
2 kuukautta sitten |