Jesse Gross
|
7121dfa309
runner.go: Retry decoding after defragmentation if needed
|
5 달 전 |
Gabe Goodhart
|
807ace5b1f
fix(runner): Set logits to 0 if false on Batch.Add
|
5 달 전 |
Michael Yang
|
549c2bdfcf
Merge pull request #7657 from ollama/mxyng/sync
|
5 달 전 |
Michael Yang
|
5b3393b6a2
fix(mllama): sync backend between batches
|
5 달 전 |
Daniel Hiltgen
|
df011054fa
Jetpack support for Go server (#7217)
|
5 달 전 |
Jesse Gross
|
312d9de1d1
llama: Improve error handling
|
6 달 전 |
Jesse Gross
|
a103dae01e
runner.go: Only allocate 1 element embedding batches for mllama
|
6 달 전 |
Jesse Gross
|
c826e57475
runner.go: Better abstract vision model integration
|
6 달 전 |
Daniel Hiltgen
|
712e99d477
Soften windows clang requirement (#7428)
|
6 달 전 |
Daniel Hiltgen
|
b754f5a6a3
Remove submodule and shift to Go server - 0.4.0 (#7157)
|
6 달 전 |
Jesse Gross
|
de1557a0dc
runner.go: Better handle return NULL values from llama.cpp
|
6 달 전 |
Daniel Hiltgen
|
3085c47bea
Improve dependency gathering logic (#7345)
|
6 달 전 |
Patrick Devine
|
c7cb0f0602
image processing for llama3.2 (#6963)
|
6 달 전 |
Daniel Hiltgen
|
f86d00cd95
llama: add compiler tags for cpu features (#7137)
|
6 달 전 |
Gabe Goodhart
|
f2890a4494
IBM granite/granitemoe architecture support (#6760)
|
6 달 전 |
Daniel Hiltgen
|
7d6eb0d4c3
Move macos v11 support flags to build script (#7203)
|
6 달 전 |
Daniel Hiltgen
|
5dd0477fd4
Fix regression on older macos versions (#7192)
|
6 달 전 |
Jeffrey Morgan
|
96efd9052f
Re-introduce the `llama` package (#5034)
|
6 달 전 |
Michael Yang
|
fccf8d179f
partial decode ggml bin for more info
|
1 년 전 |
Bruce MacDonald
|
984c9c628c
fix embeddings invalid values
|
1 년 전 |
Bruce MacDonald
|
09d8bf6730
fix build errors
|
1 년 전 |
Bruce MacDonald
|
7a5f3616fd
embed text document in modelfile
|
1 년 전 |
Michael Yang
|
f2074ed4c0
Merge pull request #306 from jmorganca/default-keep-system
|
1 년 전 |
Bruce MacDonald
|
a6f6d18f83
embed text document in modelfile
|
1 년 전 |
Jeffrey Morgan
|
5eb712f962
trim whitespace before checking stop conditions
|
1 년 전 |
Michael Yang
|
4dc5b117dd
automatically set num_keep if num_keep < 0
|
1 년 전 |
Michael Yang
|
b9f4d67554
configurable rope frequency parameters
|
1 년 전 |
Michael Yang
|
c5bcf32823
update llama.cpp
|
1 년 전 |
Michael Yang
|
74a5f7e698
no gpu for 70B model
|
1 년 전 |
Michael Yang
|
319f078dd9
remove -Werror
|
1 년 전 |