Commit History

Author SHA1 Message Date
  Blake Mizerany cb42e607c5 llm: speed up gguf decoding by a lot (#5246) 10 months ago
  Michael Yang c16f8af911 fix: multiple templates when creating from model 10 months ago
  Michael Yang d61ef8b954 update create handler to use model.Name 1 year ago
  Michael Yang e40145a39d lint 11 months ago
  Michael Yang f36f1d6be9 tidy intermediate blobs 11 months ago
  Michael Yang 3520c0e4d5 cache and reuse intermediate blobs 11 months ago
  Michael Yang b2f00aa977 close zip files 1 year ago
  Michael Yang f5e8b207fb s/DisplayLongest/String/ 1 year ago
  Michael Yang 4d0d0fa383 no iterator 1 year ago
  Michael Yang 01811c176a comments 1 year ago
  Michael Yang 9685c34509 quantize any fp16/fp32 model 1 year ago