Commit History

Author SHA1 Message Date
  Michael Yang 5a28b9cf5f bert 11 months ago
  Michael Yang d8e2664c33 convert: fix parse functions 9 months ago
  Michael Yang eafc607abb convert: only extract large files 10 months ago
  Michael Yang df993fa37b comments 10 months ago
  Michael Yang 5e9db9fb0b refactor convert 11 months ago
  Michael Yang c895a7d13f some gocritic 11 months ago
  Ikko Eltociear Ashimine 955c317cab chore: update tokenizer.go (#4571) 11 months ago
  Michael Yang bbbd9f20f3 cleanup 11 months ago
  Michael Yang 547132e820 bpe pretokenizer 11 months ago
  Patrick Devine 2d315ba9a9 add missing file 1 year ago