提交歷史

作者 SHA1 備註 提交日期
  Blake Mizerany cb42e607c5 llm: speed up gguf decoding by a lot (#5246) 10 月之前
  Michael Yang c16f8af911 fix: multiple templates when creating from model 10 月之前
  Michael Yang d61ef8b954 update create handler to use model.Name 1 年之前
  Michael Yang e40145a39d lint 11 月之前
  Michael Yang f36f1d6be9 tidy intermediate blobs 11 月之前
  Michael Yang 3520c0e4d5 cache and reuse intermediate blobs 11 月之前
  Michael Yang b2f00aa977 close zip files 1 年之前
  Michael Yang f5e8b207fb s/DisplayLongest/String/ 1 年之前
  Michael Yang 4d0d0fa383 no iterator 1 年之前
  Michael Yang 01811c176a comments 1 年之前
  Michael Yang 9685c34509 quantize any fp16/fp32 model 1 年之前