OpenSource/ollama

Autor	SHA1 Nachricht	Datum
Michael Yang	74bd09652d ml/backend/ggml: load tensors in 32KiB chunks	vor 1 Monat
Jesse Gross	0ff28758b3 ollamarunner: Provide mechanism for backends to report loading progress	vor 1 Monat
Michael Yang	63a394068c use 2d pooling	vor 1 Monat
Michael Yang	0df1800436 set non-causal attention	vor 1 Monat
Michael Yang	4b037a97dc add gemma vision encoder	vor 1 Monat
Patrick Devine	5f74d1fd47 gemma2 impl	vor 2 Monaten
Michael Yang	9926eae015 fix: pad tensor item if ge zero	vor 1 Monat
Jesse Gross	4100ed7bdd ml: Add support for quantized KV cache	vor 2 Monaten
Michael Yang	7bae7fa5ce ml/backend/ggml: create tensor on specific backend	vor 2 Monaten
Michael Yang	764e199d67 kvcache: create cache ctx per layer	vor 2 Monaten
Michael Yang	05a01fdecb ml/backend/ggml: consolidate system info logging	vor 2 Monaten
Jesse Gross	21aa666a1e ml: Enable support for flash attention	vor 2 Monaten
Jesse Gross	ee141cc821 ml: Empty tensor constructor for tensors	vor 2 Monaten
Jesse Gross	854a9195f3 attention: Remove unnecessary contiguous operations	vor 2 Monaten
Michael Yang	3e8b8a1933 ml: update Context.Forward interface	vor 2 Monaten
Michael Yang	53d2990d9b model: add bos token if configured	vor 2 Monaten
Jesse Gross	f53f4198c3 ml: Abstract attention out of model definitions	vor 2 Monaten
Jesse Gross	bd6a7d5e64 ollamarunner: Pass runner performance parameters to backends	vor 2 Monaten
Daniel Hiltgen	df2680b4b9 Wire up system info log for new engine (#9123)	vor 2 Monaten
Jesse Gross	ed443a0393 Runner for Ollama engine	vor 4 Monaten
Jesse Gross	d773b7d671 backend: API to support full precision matmul	vor 2 Monaten
Jesse Gross	4d4463b2bd backend: Support graph computation that does not return an output	vor 2 Monaten
Jesse Gross	0e38297f87 backend: Consistently use int (vs. int64) for tensor shapes	vor 2 Monaten
Jesse Gross	7e13f568dc backend: Don't return an error on Close	vor 2 Monaten
Michael Yang	58245413f4 next ollama runner (#7913)	vor 2 Monaten

Commit Verlauf Finden

Commit Verlauf