OpenSource/ollama

Autor	SHA1 Mensaxe	Data
Michael Yang	7e33a017c0 partial offloading	hai 1 ano
Michael Yang	8b2c10061c refactor tensor query	hai 1 ano
Michael Yang	01f77ae25d add command-r graph estimate	hai 1 ano
Michael Yang	12e923e158 update graph size estimate	hai 1 ano
Michael Yang	90f071c658 default head_kv to 1	hai 1 ano
Michael Yang	91b3e4d282 update memory calcualtions	hai 1 ano
Michael Yang	d338d70492 refactor model parsing	hai 1 ano
Patrick Devine	5a5efee46b Add gemma safetensors conversion (#3250)	hai 1 ano
Michael Yang	0085297928 refactor readseeker	hai 1 ano
Michael Yang	76bdebbadf decode ggla	hai 1 ano
Patrick Devine	2c017ca441 Convert Safetensors to an Ollama model (#2824)	hai 1 ano
Michael Yang	949d7b1c48 add gguf file types (#2532)	hai 1 ano
Michael Yang	eaed6f8c45 add max context length check	hai 1 ano
Michael Yang	2bb2bdd5d4 fix lint	hai 1 ano
Jeffrey Morgan	08f1e18965 Offload layers to GPU based on new model size estimates (#1850)	hai 1 ano
Bruce MacDonald	811b1f03c8 deprecate ggml	hai 1 ano
Jeffrey Morgan	d9a250e9b5 seek to end of file when decoding older model formats	hai 1 ano
Jeffrey Morgan	944519ed16 seek to eof for older model binaries	hai 1 ano
Michael Yang	72e7a49aa9 seek instead of copyn	hai 1 ano
Michael Yang	2cb0fa7d40 split from into one or more models	hai 1 ano
Michael Yang	b2816bca67 unnecessary ReadSeeker for DecodeGGML	hai 1 ano
Michael Yang	125d0a013a ggufv3	hai 1 ano
Michael Yang	c02c0cd483 starcoder	hai 1 ano
Bruce MacDonald	86279f4ae3 unbound max num gpu layers (#591)	hai 1 ano
Bruce MacDonald	4cba75efc5 remove tmp directories created by previous servers (#559)	hai 1 ano
Bruce MacDonald	66003e1d05 subprocess improvements (#524)	hai 1 ano
Bruce MacDonald	2540c9181c support for packaging in multiple cuda runners (#509)	hai 1 ano
Michael Yang	7dee25a07f fix falcon decode	hai 1 ano
Bruce MacDonald	09dd2aeff9 GGUF support (#441)	hai 1 ano
Michael Yang	b1cececb8e add 34b model type	hai 1 ano

Posterior Anterior

Commit History Buscar

Commit History