Histórico de Commits

Autor SHA1 Mensagem Data
  Michael Yang a8b9b930b4 account for all non-repeating layers há 1 ano atrás
  ManniX-ITA bd54b08261 Streamlined WaitUntilRunning há 1 ano atrás
  Michael Yang 26df674785 scale graph based on gpu count há 1 ano atrás
  Michael Yang 41a272de9f darwin: no partial offloading if required memory greater than system há 1 ano atrás
  Jeffrey Morgan a0b8a32eb4 Terminate subprocess if receiving `SIGINT` or `SIGTERM` signals while model is loading (#3653) há 1 ano atrás
  Michael Yang 7e33a017c0 partial offloading há 1 ano atrás
  Michael Yang 8b2c10061c refactor tensor query há 1 ano atrás
  Daniel Hiltgen c5ff443b9f Handle very slow model loads há 1 ano atrás
  Michael Yang be517e491c no rope parameters há 1 ano atrás
  Michael Yang 12e923e158 update graph size estimate há 1 ano atrás
  Daniel Hiltgen 464d817824 Merge pull request #3464 from dhiltgen/subprocess há 1 ano atrás
  Daniel Hiltgen 6589eb8a8c Revert options as a ref in the server há 1 ano atrás
  Michael Yang 80163ebcb5 fix metal gpu há 1 ano atrás
  Daniel Hiltgen 58d95cc9bd Switch back to subprocessing for llama.cpp há 1 ano atrás