OpenSource/ollama

作者	SHA1 备注	提交日期
Jeffrey Morgan	6164f378f2 revert cuda overhead to 20%	1 年之前
Jeffrey Morgan	6566387ae3 add `TODO` for cuda overhead	1 年之前
Jeffrey Morgan	37708931fb update cuda overhead to 20% to fix crashes when switching between models and large context sizes	1 年之前
Jeffrey Morgan	f6cb0a553c update cuda overhead to 15% or 400MiB	1 年之前
Jeffrey Morgan	2680078c13 fix build on linux	1 年之前
Jeffrey Morgan	f1b7e5f560 update overhead to 15%	1 年之前
Jeffrey Morgan	cb534e6ac2 use 10% vram overhead for cuda	1 年之前
Jeffrey Morgan	08f1e18965 Offload layers to GPU based on new model size estimates (#1850)	1 年之前
Daniel Hiltgen	d74ce6bd4f Detect very old CUDA GPUs and fall back to CPU	1 年之前
Daniel Hiltgen	a2ad952440 Fix windows system memory lookup	1 年之前
Daniel Hiltgen	d966b730ac Switch windows build to fully dynamic	1 年之前
Daniel Hiltgen	7555ea44f8 Revamp the dynamic library shim	1 年之前
Daniel Hiltgen	1b991d0ba9 Refine build to support CPU only	1 年之前
Daniel Hiltgen	35934b2e05 Adapted rocm support to cgo based llama.cpp	1 年之前