Автор | SHA1 Сообщение | Дата |
---|---|---|
|
f0c454ab57 gpu: add 512MiB to darwin minimum, metal doesn't have partial offloading overhead (#4068) | 1 год назад |
|
f81f308118 fix gemma, command-r layer weights | 1 год назад |
|
7bb7cb8a60 only count output tensors | 1 год назад |
|
5445aaa94e Add back memory escape valve | 1 год назад |
|
34b9db5afc Request and model concurrency | 1 год назад |