提交历史

作者 SHA1 备注 提交日期
  jmorganca ad7e641815 add batch embeddings 1 年之前
  Jeffrey Morgan 00b0699c75 Reload model if `num_gpu` changes (#3920) 1 年之前
  Bryce Reitano 36a6daccab Restructure loading conditional chain 1 年之前
  Bryce Reitano ceb0e26e5e Provide variable ggml for TestLoad 1 年之前
  Bryce Reitano 284e02bed0 Move ggml loading to when we attempt fitting 1 年之前
  Daniel Hiltgen d8851cb7a0 Harden sched TestLoad 1 年之前
  Daniel Hiltgen 34b9db5afc Request and model concurrency 1 年之前