Michael Yang
|
41ae232e10
split model layer into metadata and data layers
|
1 год назад |
Michael Yang
|
da0bb5d772
comments
|
1 год назад |
Michael Yang
|
1d8c850f38
quantize any fp16/fp32 model
|
1 год назад |
Michael Yang
|
435cc866a3
fix: mixtral graph
|
1 год назад |
Michael Yang
|
3cf483fe48
add stablelm graph calculation
|
1 год назад |
Michael Yang
|
a8b9b930b4
account for all non-repeating layers
|
1 год назад |
Michael Yang
|
3397eff0cd
mixtral mem
|
1 год назад |
Michael Yang
|
7e33a017c0
partial offloading
|
1 год назад |
Michael Yang
|
8b2c10061c
refactor tensor query
|
1 год назад |
Michael Yang
|
01f77ae25d
add command-r graph estimate
|
1 год назад |
Michael Yang
|
12e923e158
update graph size estimate
|
1 год назад |
Michael Yang
|
90f071c658
default head_kv to 1
|
1 год назад |
Michael Yang
|
91b3e4d282
update memory calcualtions
|
1 год назад |
Michael Yang
|
d338d70492
refactor model parsing
|
1 год назад |
Patrick Devine
|
5a5efee46b
Add gemma safetensors conversion (#3250)
|
1 год назад |
Michael Yang
|
0085297928
refactor readseeker
|
1 год назад |
Michael Yang
|
76bdebbadf
decode ggla
|
1 год назад |
Patrick Devine
|
2c017ca441
Convert Safetensors to an Ollama model (#2824)
|
1 год назад |
Michael Yang
|
949d7b1c48
add gguf file types (#2532)
|
1 год назад |
Michael Yang
|
eaed6f8c45
add max context length check
|
1 год назад |
Michael Yang
|
2bb2bdd5d4
fix lint
|
1 год назад |
Jeffrey Morgan
|
08f1e18965
Offload layers to GPU based on new model size estimates (#1850)
|
1 год назад |
Bruce MacDonald
|
811b1f03c8
deprecate ggml
|
1 год назад |
Jeffrey Morgan
|
d9a250e9b5
seek to end of file when decoding older model formats
|
1 год назад |
Jeffrey Morgan
|
944519ed16
seek to eof for older model binaries
|
1 год назад |
Michael Yang
|
72e7a49aa9
seek instead of copyn
|
1 год назад |
Michael Yang
|
2cb0fa7d40
split from into one or more models
|
1 год назад |
Michael Yang
|
b2816bca67
unnecessary ReadSeeker for DecodeGGML
|
1 год назад |
Michael Yang
|
125d0a013a
ggufv3
|
1 год назад |
Michael Yang
|
c02c0cd483
starcoder
|
1 год назад |