Historie revizí

Autor SHA1 Zpráva Datum
  Daniel Hiltgen bee2f4a3b0 Record GPU usage information před 1 rokem
  Michael Yang 4736391bfb llm: add minimum based on layer size před 1 rokem
  Daniel Hiltgen f56aa20014 Centralize server config handling před 1 rokem
  Jeffrey Morgan f0c454ab57 gpu: add 512MiB to darwin minimum, metal doesn't have partial offloading overhead (#4068) před 1 rokem
  Michael Yang f81f308118 fix gemma, command-r layer weights před 1 rokem
  Michael Yang 7bb7cb8a60 only count output tensors před 1 rokem
  Daniel Hiltgen 5445aaa94e Add back memory escape valve před 1 rokem
  Daniel Hiltgen 34b9db5afc Request and model concurrency před 1 rokem