Josh Yan
|
dea2204b82
rmv comments
|
9 ヶ月 前 |
Josh Yan
|
873f334783
IT WORKS
|
9 ヶ月 前 |
Josh Yan
|
25be20949c
test
|
9 ヶ月 前 |
Josh Yan
|
3d0fd31f0e
TensorWriter
|
10 ヶ月 前 |
Josh Yan
|
e75fb73839
types
|
10 ヶ月 前 |
Josh Yan
|
2fdebffc8d
sawp
|
10 ヶ月 前 |
Michael Yang
|
5a739ff4cb
chatglm graph
|
10 ヶ月 前 |
Michael Yang
|
de2163dafd
gemma2 graph
|
10 ヶ月 前 |
Blake Mizerany
|
cb42e607c5
llm: speed up gguf decoding by a lot (#5246)
|
10 ヶ月 前 |
Michael Yang
|
8e0641a9bf
handle asymmetric embedding KVs
|
10 ヶ月 前 |
Michael Yang
|
e873841cbb
deepseek v2 graph
|
10 ヶ月 前 |
Daniel Hiltgen
|
6fd04ca922
Improve multi-gpu handling at the limit
|
11 ヶ月 前 |
Michael Yang
|
7bdcd1da94
Revert "Merge pull request #4938 from ollama/mxyng/fix-byte-order"
|
11 ヶ月 前 |
Michael Yang
|
620d5c569e
fix parsing big endian gguf
|
11 ヶ月 前 |
Michael Yang
|
9b6c2e6eb6
detect chat template from KV
|
11 ヶ月 前 |
Michael Yang
|
d51f15257c
Update llm/ggml.go
|
11 ヶ月 前 |
Michael Yang
|
8f440d579a
fix q5_0, q5_1
|
11 ヶ月 前 |
Bruce MacDonald
|
d6f692ad1a
Add support for IQ1_S, IQ3_S, IQ2_S, IQ4_XS. IQ4_NL (#4322)
|
11 ヶ月 前 |
Michael Yang
|
171eb040fc
simplify safetensors reading
|
11 ヶ月 前 |
Michael Yang
|
1eb382da5a
add phi2 mem
|
1 年間 前 |
Michael Yang
|
eeb695261f
skip if same quantization
|
1 年間 前 |
Michael Yang
|
01811c176a
comments
|
1 年間 前 |
Michael Yang
|
9685c34509
quantize any fp16/fp32 model
|
1 年間 前 |
Michael Yang
|
435cc866a3
fix: mixtral graph
|
1 年間 前 |
Michael Yang
|
3cf483fe48
add stablelm graph calculation
|
1 年間 前 |
Michael Yang
|
a8b9b930b4
account for all non-repeating layers
|
1 年間 前 |
Michael Yang
|
3397eff0cd
mixtral mem
|
1 年間 前 |
Michael Yang
|
7e33a017c0
partial offloading
|
1 年間 前 |
Michael Yang
|
8b2c10061c
refactor tensor query
|
1 年間 前 |
Michael Yang
|
01f77ae25d
add command-r graph estimate
|
1 年間 前 |