OpenSource/ollama

Автор	SHA1 Сообщение	Дата
Jeffrey Morgan	c4cf8ad559 llm: avoid loading model if system memory is too small (#5637)	9 месяцев назад
Daniel Hiltgen	f6f759fc5f Detect CUDA OS Overhead	9 месяцев назад
Daniel Hiltgen	9929751cc8 Disable concurrency for AMD + Windows	10 месяцев назад
Daniel Hiltgen	da3bf23354 Workaround gfx900 SDMA bugs	11 месяцев назад
Daniel Hiltgen	6f351bf586 review comments and coverage	11 месяцев назад
Daniel Hiltgen	4e2b7e181d Refactor intel gpu discovery	11 месяцев назад
Daniel Hiltgen	6fd04ca922 Improve multi-gpu handling at the limit	11 месяцев назад
Daniel Hiltgen	43ed358f9a Refine GPU discovery to bootstrap once	11 месяцев назад
Daniel Hiltgen	8727a9c140 Record more GPU information	1 год назад
Daniel Hiltgen	34b9db5afc Request and model concurrency	1 год назад
Michael Yang	7e33a017c0 partial offloading	1 год назад
Michael Yang	91b3e4d282 update memory calcualtions	1 год назад
Daniel Hiltgen	6d84f07505 Detect AMD GPU info via sysfs and block old cards	1 год назад
Daniel Hiltgen	8da7bef05f Support multiple variants for a given llm lib type	1 год назад
Jeffrey Morgan	c336693f07 calculate overhead based number of gpu devices (#1875)	1 год назад
Daniel Hiltgen	a2ad952440 Fix windows system memory lookup	1 год назад
Daniel Hiltgen	d966b730ac Switch windows build to fully dynamic	1 год назад
Daniel Hiltgen	7555ea44f8 Revamp the dynamic library shim	1 год назад
Daniel Hiltgen	35934b2e05 Adapted rocm support to cgo based llama.cpp	1 год назад

История коммитов Найти

История коммитов