OpenSource/ollama

Autor	SHA1 Nachricht	Datum
Patrick Devine	c7cb0f0602 image processing for llama3.2 (#6963)	vor 6 Monaten
Daniel Hiltgen	05cd82ef94 Rename gpu package discover (#7143)	vor 6 Monaten
Daniel Hiltgen	56318fb365 Improve logging on GPU too small (#6666)	vor 7 Monaten
Daniel Hiltgen	b05c9e83d9 Introduce GPU Overhead env var (#5922)	vor 7 Monaten
Michael Yang	8e0641a9bf handle asymmetric embedding KVs	vor 10 Monaten
Daniel Hiltgen	359b15a597 Handle models with divergent layer sizes	vor 10 Monaten
Daniel Hiltgen	7784ca33ce Tighten up memory prediction logging	vor 10 Monaten
Daniel Hiltgen	17df6520c8 Remove mmap related output calc logic	vor 10 Monaten
Daniel Hiltgen	6f351bf586 review comments and coverage	vor 11 Monaten
Daniel Hiltgen	6fd04ca922 Improve multi-gpu handling at the limit	vor 11 Monaten
Michael Yang	6297f85606 gofmt, goimports	vor 11 Monaten
Michael Yang	e40145a39d lint	vor 11 Monaten
Patrick Devine	4cc3be3035 Move envconfig and consolidate env vars (#4608)	vor 11 Monaten
Michael Yang	1d359e737e typo	vor 11 Monaten
Michael Yang	50b9056e09 count memory up to NumGPU	vor 11 Monaten
Jeffrey Morgan	bb6fd02298 Don't clamp ctx size in `PredictServerFit` (#4317)	vor 11 Monaten
Daniel Hiltgen	bee2f4a3b0 Record GPU usage information	vor 1 Jahr
Michael Yang	4736391bfb llm: add minimum based on layer size	vor 1 Jahr
Daniel Hiltgen	f56aa20014 Centralize server config handling	vor 1 Jahr
Jeffrey Morgan	f0c454ab57 gpu: add 512MiB to darwin minimum, metal doesn't have partial offloading overhead (#4068)	vor 1 Jahr
Michael Yang	f81f308118 fix gemma, command-r layer weights	vor 1 Jahr
Michael Yang	7bb7cb8a60 only count output tensors	vor 1 Jahr
Daniel Hiltgen	5445aaa94e Add back memory escape valve	vor 1 Jahr
Daniel Hiltgen	34b9db5afc Request and model concurrency	vor 1 Jahr

Commit Verlauf Finden

Commit Verlauf