Historial de Commits

Autor SHA1 Mensaje Fecha
  Jeffrey Morgan f0c454ab57 gpu: add 512MiB to darwin minimum, metal doesn't have partial offloading overhead (#4068) hace 1 año
  Michael Yang f81f308118 fix gemma, command-r layer weights hace 1 año
  Michael Yang 7bb7cb8a60 only count output tensors hace 1 año
  Daniel Hiltgen 5445aaa94e Add back memory escape valve hace 1 año
  Daniel Hiltgen 34b9db5afc Request and model concurrency hace 1 año