Daniel Hiltgen f52d4b9879 Make new tokenizer logic conditional (#6395) 8 mēneši atpakaļ
..
ext_server 5e2653f9fe llm: update llama.cpp commit to 8962422 (#6618) 8 mēneši atpakaļ
generate f97ee8c506 Fix parallel requests 8 mēneši atpakaļ
llama.cpp @ 8962422b1c 5e2653f9fe llm: update llama.cpp commit to 8962422 (#6618) 8 mēneši atpakaļ
patches 5e2653f9fe llm: update llama.cpp commit to 8962422 (#6618) 8 mēneši atpakaļ
filetype.go e1dfc757b3 revert llm changes 8 mēneši atpakaļ
ggla.go 6b252918fb update convert test to check result data 9 mēneši atpakaļ
ggml.go e1dfc757b3 revert llm changes 8 mēneši atpakaļ
ggml_test.go cb42e607c5 llm: speed up gguf decoding by a lot (#5246) 10 mēneši atpakaļ
gguf.go 6ffb5cb017 add conversion for microsoft phi 3 mini/medium 4k, 128 8 mēneši atpakaļ
llm.go 1c36f36c41 llm: Fix array out-of-bounds memory access when tokenizing 8 mēneši atpakaļ
llm_darwin_amd64.go e12fff8810 Enable windows error dialog for subprocess startup 9 mēneši atpakaļ
llm_darwin_arm64.go e12fff8810 Enable windows error dialog for subprocess startup 9 mēneši atpakaļ
llm_linux.go e12fff8810 Enable windows error dialog for subprocess startup 9 mēneši atpakaļ
llm_windows.go e12fff8810 Enable windows error dialog for subprocess startup 9 mēneši atpakaļ
memory.go 8e0641a9bf handle asymmetric embedding KVs 10 mēneši atpakaļ
memory_test.go 77903ab8b4 llama3.1 8 mēneši atpakaļ
payload.go d470ebe78b Add Jetson cuda variants for arm 8 mēneši atpakaļ
server.go f52d4b9879 Make new tokenizer logic conditional (#6395) 8 mēneši atpakaļ
status.go 04210aa6dd Catch one more error log 9 mēneši atpakaļ