Jesse Gross
|
0c220935bd
input: Rename Options to Batch
|
1 hónapja |
Jesse Gross
|
a1cda80bcb
model: Update encoder cache to use multimodal input processing handler
|
1 hónapja |
Michael Yang
|
7bae7fa5ce
ml/backend/ggml: create tensor on specific backend
|
2 hónapja |
Michael Yang
|
764e199d67
kvcache: create cache ctx per layer
|
2 hónapja |
Jesse Gross
|
ee141cc821
ml: Empty tensor constructor for tensors
|
2 hónapja |
Jesse Gross
|
854a9195f3
attention: Remove unnecessary contiguous operations
|
2 hónapja |
Michael Yang
|
3e8b8a1933
ml: update Context.Forward interface
|
2 hónapja |
Jesse Gross
|
ed443a0393
Runner for Ollama engine
|
4 hónapja |