История коммитов

Автор SHA1 Сообщение Дата
  Roy Han 23d5beeb9c input 9 месяцев назад
  Roy Han eb7cc2d1ce image embeddings 9 месяцев назад
  Roy Han 8f6d0242b6 refactoring 10 месяцев назад
  Roy Han c697eb2a9b fix hanging on single string 10 месяцев назад
  Roy Han bcb63e6e0e touches 10 месяцев назад
  royjhan b7c622dd32 Merge branch 'main' into royh-batchembed 10 месяцев назад
  Jeffrey Morgan d8def1ff94 llm: allow gemma 2 to context shift (#5534) 10 месяцев назад
  Jeffrey Morgan 0e09c380fc llm: print caching notices in debug only (#5533) 10 месяцев назад
  Jeffrey Morgan d89454de80 Use slot with cached prompt instead of least recently used (#5492) 10 месяцев назад
  Roy Han 17de2b4405 Refactoring of legacy and new 10 месяцев назад
  royjhan 3b5a4a77f3 Return Correct Prompt Eval Count Regardless of Cache Prompt (#5371) 10 месяцев назад
  royjhan a5f23d766e Merge branch 'main' into royh-batchembed 10 месяцев назад
  Roy Han 512e0a7bde Clean up 10 месяцев назад
  Roy Han aee25acb5b move normalization to go 10 месяцев назад
  Jeffrey Morgan 717f7229eb Do not shift context for sliding window models (#5368) 10 месяцев назад
  Roy Han 80c1a3f812 playing around with truncate stuff 10 месяцев назад
  Roy Han c111d8bb51 normalization 10 месяцев назад
  Roy Han 5213c12354 clean up 10 месяцев назад
  Roy Han 49e341147d add server function 10 месяцев назад
  Roy Han c406fa7a4c api/embed draft 10 месяцев назад
  Roy Han ff191d7cba Initial Draft 10 месяцев назад
  Michael Yang 9d91e5e587 remove confusing log message 10 месяцев назад
  Daniel Hiltgen fb9cdfa723 Fix server.cpp for the new cuda build macros 11 месяцев назад
  Jeffrey Morgan ead259d877 llm: fix seed value not being applied to requests (#4986) 10 месяцев назад
  Jeffrey Morgan 34f142797a llm: always add bos token to prompt (#4941) 11 месяцев назад
  Michael Yang 829ff87bd1 revert tokenize ffi (#4761) 11 месяцев назад
  Michael Yang de781b37c8 rm unused infill 11 месяцев назад
  Michael Yang 3e21799377 rm unused system prompt 11 месяцев назад
  Michael Yang 26a00a0410 use ffi for tokenizing/detokenizing 11 месяцев назад
  Michael Yang 714adb8bd1 bump (#4597) 11 месяцев назад