Shane-XB-Qian
|
6b45b1d6b4
cli: adding support ctrl-n/p like general cli (#9136)
|
hace 1 mes |
frob
|
b3af953a55
cli: don't exit for invalid model during /load. (#9576)
|
hace 1 mes |
Michael
|
ad4e0bf3be
Adding Gemma 3 to readme (#9671)
|
hace 1 mes |
Michael Yang
|
aee28501b5
Merge pull request #9661 from ollama/gemma
|
hace 1 mes |
jmorganca
|
83f0ec8269
all: address linter errors
|
hace 1 mes |
jmorganca
|
c6b6938b3a
kvcache: fix tests by adding AvgPool2D stub
|
hace 1 mes |
jmorganca
|
fb4664fcec
model: add more spm tokenizer tests
|
hace 1 mes |
jmorganca
|
20e3593863
model: validate left and right pairs before merging them
|
hace 1 mes |
Michael Yang
|
63a394068c
use 2d pooling
|
hace 1 mes |
Daniel Hiltgen
|
ab39e08eb9
llm: auto detect models that require Ollama Engine (#1)
|
hace 1 mes |
jmorganca
|
11bfa62796
add trailing \n\n after <end_of_image> to match reference implementation
|
hace 1 mes |
jmorganca
|
f63e62e546
reduce kernel size, add TODO for loading from config
|
hace 1 mes |
jmorganca
|
65b0f329d1
Revert "Allow models to force a new batch"
|
hace 1 mes |
Jesse Gross
|
06007c0a18
Allow models to force a new batch
|
hace 1 mes |
Jesse Gross
|
a8e83a7654
Disable causal attention based on batch index
|
hace 1 mes |
Jesse Gross
|
475005504e
Restrict Gemma to a single image per request
|
hace 1 mes |
Jesse Gross
|
2c40c4d35e
Fix follow up images and images split across batches
|
hace 1 mes |
Michael Yang
|
e95278932b
use non-causal mask only for image positions
|
hace 1 mes |
Michael Yang
|
9d2a20a763
use non-causal mask for inputs with images
|
hace 1 mes |
Patrick Devine
|
2e54d72fc3
fix gemma3 1b conversion
|
hace 1 mes |
Michael Yang
|
6b32a2d549
compat with upstream gguf
|
hace 1 mes |
Michael Yang
|
c5cbe4fc2a
fallback to cpu
|
hace 1 mes |
Michael Yang
|
f888912870
fix vision encoder
|
hace 1 mes |
Michael Yang
|
9e4642e9b3
ollama debug tensor
|
hace 1 mes |
Michael Yang
|
6b0486c216
duplicate token_embd to output
|
hace 1 mes |
Michael Yang
|
d368c039f0
skip repacking vision tensors
|
hace 1 mes |
Patrick Devine
|
9b54267e69
fix configs
|
hace 1 mes |
Michael Yang
|
46bb0169c4
update model
|
hace 1 mes |
Michael Yang
|
8934324b72
use fast attention
|
hace 1 mes |
Jesse Gross
|
0e886595bf
Fix tests and drift from main
|
hace 1 mes |