Историја ревизија

Аутор SHA1 Порука Датум
  Michael Yang 8e0641a9bf handle asymmetric embedding KVs пре 10 месеци
  Daniel Hiltgen 359b15a597 Handle models with divergent layer sizes пре 10 месеци
  Daniel Hiltgen 7784ca33ce Tighten up memory prediction logging пре 10 месеци
  Daniel Hiltgen 17df6520c8 Remove mmap related output calc logic пре 10 месеци
  Daniel Hiltgen 6f351bf586 review comments and coverage пре 11 месеци
  Daniel Hiltgen 6fd04ca922 Improve multi-gpu handling at the limit пре 11 месеци
  Michael Yang 6297f85606 gofmt, goimports пре 11 месеци
  Michael Yang e40145a39d lint пре 11 месеци
  Patrick Devine 4cc3be3035 Move envconfig and consolidate env vars (#4608) пре 11 месеци
  Michael Yang 1d359e737e typo пре 11 месеци
  Michael Yang 50b9056e09 count memory up to NumGPU пре 11 месеци
  Jeffrey Morgan bb6fd02298 Don't clamp ctx size in `PredictServerFit` (#4317) пре 11 месеци
  Daniel Hiltgen bee2f4a3b0 Record GPU usage information пре 1 година
  Michael Yang 4736391bfb llm: add minimum based on layer size пре 1 година
  Daniel Hiltgen f56aa20014 Centralize server config handling пре 1 година
  Jeffrey Morgan f0c454ab57 gpu: add 512MiB to darwin minimum, metal doesn't have partial offloading overhead (#4068) пре 1 година
  Michael Yang f81f308118 fix gemma, command-r layer weights пре 1 година
  Michael Yang 7bb7cb8a60 only count output tensors пре 1 година
  Daniel Hiltgen 5445aaa94e Add back memory escape valve пре 1 година
  Daniel Hiltgen 34b9db5afc Request and model concurrency пре 1 година