Commit History

Автор SHA1 Съобщение Дата
  royjhan a5f23d766e Merge branch 'main' into royh-batchembed преди 10 месеца
  Roy Han 512e0a7bde Clean up преди 10 месеца
  Roy Han aee25acb5b move normalization to go преди 10 месеца
  Jeffrey Morgan 717f7229eb Do not shift context for sliding window models (#5368) преди 10 месеца
  Roy Han 80c1a3f812 playing around with truncate stuff преди 10 месеца
  Roy Han c111d8bb51 normalization преди 10 месеца
  Roy Han 5213c12354 clean up преди 10 месеца
  Roy Han 49e341147d add server function преди 10 месеца
  Roy Han c406fa7a4c api/embed draft преди 10 месеца
  Roy Han ff191d7cba Initial Draft преди 10 месеца
  Michael Yang 9d91e5e587 remove confusing log message преди 10 месеца
  Daniel Hiltgen fb9cdfa723 Fix server.cpp for the new cuda build macros преди 11 месеца
  Jeffrey Morgan ead259d877 llm: fix seed value not being applied to requests (#4986) преди 10 месеца
  Jeffrey Morgan 34f142797a llm: always add bos token to prompt (#4941) преди 11 месеца
  Michael Yang 829ff87bd1 revert tokenize ffi (#4761) преди 11 месеца
  Michael Yang de781b37c8 rm unused infill преди 11 месеца
  Michael Yang 3e21799377 rm unused system prompt преди 11 месеца
  Michael Yang 26a00a0410 use ffi for tokenizing/detokenizing преди 1 година
  Michael Yang 714adb8bd1 bump (#4597) преди 11 месеца
  Daniel Hiltgen b37b496a12 Wire up load progress преди 11 месеца
  Sam e15307fdf4 feat: add support for flash_attn (#4120) преди 11 месеца
  Michael Yang 58876091f7 log clean up преди 1 година
  Daniel Hiltgen 920a4b0794 Merge remote-tracking branch 'upstream/main' into pr3702 преди 1 година
  Michael Yang 44869c59d6 omit prompt and generate settings from final response преди 1 година
  jmorganca fcf4d60eee llm: add back check for empty token cache преди 1 година
  Jeffrey Morgan 18d9a7e1f1 update llama.cpp submodule to `f364eb6` (#4060) преди 1 година
  Daniel Hiltgen 23d23409a0 Update llama.cpp (#4036) преди 1 година
  ManniX-ITA c942e4a07b Fixed startup sequence to report model loading преди 1 година
  Jeffrey Morgan 7c9792a6e0 Support unicode characters in model path (#3681) преди 1 година
  Daniel Hiltgen 0a0e9f3e0f Apply 01-cache.diff преди 1 година