OpenSource/ollama

Author	SHA1 Message	Date
Michael Yang	620d5c569e fix parsing big endian gguf	11 months ago
Michael Yang	9b6c2e6eb6 detect chat template from KV	11 months ago
Michael Yang	d51f15257c Update llm/ggml.go	11 months ago
Michael Yang	8f440d579a fix q5_0, q5_1	11 months ago
Bruce MacDonald	d6f692ad1a Add support for IQ1_S, IQ3_S, IQ2_S, IQ4_XS. IQ4_NL (#4322)	11 months ago
Michael Yang	171eb040fc simplify safetensors reading	11 months ago
Michael Yang	1eb382da5a add phi2 mem	1 year ago
Michael Yang	eeb695261f skip if same quantization	1 year ago
Michael Yang	01811c176a comments	1 year ago
Michael Yang	9685c34509 quantize any fp16/fp32 model	1 year ago
Michael Yang	435cc866a3 fix: mixtral graph	1 year ago
Michael Yang	3cf483fe48 add stablelm graph calculation	1 year ago
Michael Yang	a8b9b930b4 account for all non-repeating layers	1 year ago
Michael Yang	3397eff0cd mixtral mem	1 year ago
Michael Yang	7e33a017c0 partial offloading	1 year ago
Michael Yang	8b2c10061c refactor tensor query	1 year ago
Michael Yang	01f77ae25d add command-r graph estimate	1 year ago
Michael Yang	12e923e158 update graph size estimate	1 year ago
Michael Yang	90f071c658 default head_kv to 1	1 year ago
Michael Yang	91b3e4d282 update memory calcualtions	1 year ago
Michael Yang	d338d70492 refactor model parsing	1 year ago
Patrick Devine	5a5efee46b Add gemma safetensors conversion (#3250)	1 year ago
Michael Yang	0085297928 refactor readseeker	1 year ago
Michael Yang	76bdebbadf decode ggla	1 year ago
Patrick Devine	2c017ca441 Convert Safetensors to an Ollama model (#2824)	1 year ago
Michael Yang	949d7b1c48 add gguf file types (#2532)	1 year ago
Michael Yang	eaed6f8c45 add max context length check	1 year ago
Michael Yang	2bb2bdd5d4 fix lint	1 year ago
Jeffrey Morgan	08f1e18965 Offload layers to GPU based on new model size estimates (#1850)	1 year ago
Bruce MacDonald	811b1f03c8 deprecate ggml	1 year ago

Newer Older

Commit History Find

Commit History