Histórico de Commits

Autor SHA1 Mensagem Data
  Patrick Devine 4cc3be3035 Move envconfig and consolidate env vars (#4608) há 11 meses atrás
  Jeffrey Morgan 38255d2af1 Use flash attention flag for now (#4580) há 11 meses atrás
  Patrick Devine 6845988807 Ollama `ps` command for showing currently loaded models (#4327) há 11 meses atrás
  Daniel Hiltgen 0a954e5066 Fix stale test logic há 1 ano atrás
  Jeffrey Morgan dfa2f32ca0 unload in critical section (#4187) há 1 ano atrás
  Daniel Hiltgen f56aa20014 Centralize server config handling há 1 ano atrás
  Daniel Hiltgen 9a32c514cb Soften timeouts on sched unit tests há 1 ano atrás
  Daniel Hiltgen d6e3b64582 Fix concurrency for CPU mode há 1 ano atrás
  Jeffrey Morgan 00b0699c75 Reload model if `num_gpu` changes (#3920) há 1 ano atrás
  Bryce Reitano 36a6daccab Restructure loading conditional chain há 1 ano atrás
  Bryce Reitano ceb0e26e5e Provide variable ggml for TestLoad há 1 ano atrás
  Bryce Reitano 284e02bed0 Move ggml loading to when we attempt fitting há 1 ano atrás
  Daniel Hiltgen d8851cb7a0 Harden sched TestLoad há 1 ano atrás
  Daniel Hiltgen 34b9db5afc Request and model concurrency há 1 ano atrás