OpenSource/ollama

Autor	SHA1 Mensaxe	Data
Michael Yang	d51f15257c Update llm/ggml.go	hai 11 meses
Michael Yang	8f440d579a fix q5_0, q5_1	hai 11 meses
Bruce MacDonald	d6f692ad1a Add support for IQ1_S, IQ3_S, IQ2_S, IQ4_XS. IQ4_NL (#4322)	hai 11 meses
Michael Yang	171eb040fc simplify safetensors reading	hai 11 meses
Michael Yang	1eb382da5a add phi2 mem	hai 11 meses
Michael Yang	eeb695261f skip if same quantization	hai 1 ano
Michael Yang	01811c176a comments	hai 1 ano
Michael Yang	9685c34509 quantize any fp16/fp32 model	hai 1 ano
Michael Yang	435cc866a3 fix: mixtral graph	hai 1 ano
Michael Yang	3cf483fe48 add stablelm graph calculation	hai 1 ano
Michael Yang	a8b9b930b4 account for all non-repeating layers	hai 1 ano
Michael Yang	3397eff0cd mixtral mem	hai 1 ano
Michael Yang	7e33a017c0 partial offloading	hai 1 ano
Michael Yang	8b2c10061c refactor tensor query	hai 1 ano
Michael Yang	01f77ae25d add command-r graph estimate	hai 1 ano
Michael Yang	12e923e158 update graph size estimate	hai 1 ano
Michael Yang	90f071c658 default head_kv to 1	hai 1 ano
Michael Yang	91b3e4d282 update memory calcualtions	hai 1 ano
Michael Yang	d338d70492 refactor model parsing	hai 1 ano
Patrick Devine	5a5efee46b Add gemma safetensors conversion (#3250)	hai 1 ano
Michael Yang	0085297928 refactor readseeker	hai 1 ano
Michael Yang	76bdebbadf decode ggla	hai 1 ano
Patrick Devine	2c017ca441 Convert Safetensors to an Ollama model (#2824)	hai 1 ano
Michael Yang	949d7b1c48 add gguf file types (#2532)	hai 1 ano
Michael Yang	eaed6f8c45 add max context length check	hai 1 ano
Michael Yang	2bb2bdd5d4 fix lint	hai 1 ano
Jeffrey Morgan	08f1e18965 Offload layers to GPU based on new model size estimates (#1850)	hai 1 ano
Bruce MacDonald	811b1f03c8 deprecate ggml	hai 1 ano
Jeffrey Morgan	d9a250e9b5 seek to end of file when decoding older model formats	hai 1 ano
Jeffrey Morgan	944519ed16 seek to eof for older model binaries	hai 1 ano

Posterior Anterior

Commit History Buscar

Commit History