提交歷史

作者 SHA1 備註 提交日期
  Blake Mizerany cb42e607c5 llm: speed up gguf decoding by a lot (#5246) 10 月之前
  Michael Yang c16f8af911 fix: multiple templates when creating from model 10 月之前
  Michael Yang d61ef8b954 update create handler to use model.Name 1 年之前
  Michael Yang e40145a39d lint 11 月之前
  Michael Yang f36f1d6be9 tidy intermediate blobs 11 月之前
  Michael Yang 3520c0e4d5 cache and reuse intermediate blobs 1 年之前
  Michael Yang b2f00aa977 close zip files 1 年之前
  Michael Yang f5e8b207fb s/DisplayLongest/String/ 1 年之前
  Michael Yang 4d0d0fa383 no iterator 1 年之前
  Michael Yang 01811c176a comments 1 年之前
  Michael Yang 9685c34509 quantize any fp16/fp32 model 1 年之前