Jesse Gross
|
9679f40146
ml: Allow models to constrain inputs to a single batch
|
1 hónapja |
Bruce MacDonald
|
a70820daa0
models/gemma3: remove final logit softcap (#9692)
|
1 hónapja |
Jesse Gross
|
a8e83a7654
Disable causal attention based on batch index
|
1 hónapja |
Jesse Gross
|
2c40c4d35e
Fix follow up images and images split across batches
|
1 hónapja |
Michael Yang
|
e95278932b
use non-causal mask only for image positions
|
1 hónapja |
Michael Yang
|
9d2a20a763
use non-causal mask for inputs with images
|
1 hónapja |
Michael Yang
|
6b32a2d549
compat with upstream gguf
|
1 hónapja |
Michael Yang
|
f888912870
fix vision encoder
|
1 hónapja |
Patrick Devine
|
9b54267e69
fix configs
|
1 hónapja |
Michael Yang
|
46bb0169c4
update model
|
1 hónapja |
Patrick Devine
|
c62861f4fa
fix conversion
|
1 hónapja |
Michael Yang
|
0df1800436
set non-causal attention
|
1 hónapja |
Jesse Gross
|
4346c2409d
fix drift from main
|
1 hónapja |
Michael Yang
|
4b037a97dc
add gemma vision encoder
|
1 hónapja |
Patrick Devine
|
5f74d1fd47
gemma2 impl
|
2 hónapja |