Patrick Devine
|
c7cb0f0602
image processing for llama3.2 (#6963)
|
6 місяців тому |
Daniel Hiltgen
|
f86d00cd95
llama: add compiler tags for cpu features (#7137)
|
6 місяців тому |
Gabe Goodhart
|
f2890a4494
IBM granite/granitemoe architecture support (#6760)
|
6 місяців тому |
Daniel Hiltgen
|
7d6eb0d4c3
Move macos v11 support flags to build script (#7203)
|
6 місяців тому |
Daniel Hiltgen
|
5dd0477fd4
Fix regression on older macos versions (#7192)
|
6 місяців тому |
Jeffrey Morgan
|
96efd9052f
Re-introduce the `llama` package (#5034)
|
6 місяців тому |
Michael Yang
|
fccf8d179f
partial decode ggml bin for more info
|
1 рік тому |
Bruce MacDonald
|
984c9c628c
fix embeddings invalid values
|
1 рік тому |
Bruce MacDonald
|
09d8bf6730
fix build errors
|
1 рік тому |
Bruce MacDonald
|
7a5f3616fd
embed text document in modelfile
|
1 рік тому |
Michael Yang
|
f2074ed4c0
Merge pull request #306 from jmorganca/default-keep-system
|
1 рік тому |
Bruce MacDonald
|
a6f6d18f83
embed text document in modelfile
|
1 рік тому |
Jeffrey Morgan
|
5eb712f962
trim whitespace before checking stop conditions
|
1 рік тому |
Michael Yang
|
4dc5b117dd
automatically set num_keep if num_keep < 0
|
1 рік тому |
Michael Yang
|
b9f4d67554
configurable rope frequency parameters
|
1 рік тому |
Michael Yang
|
c5bcf32823
update llama.cpp
|
1 рік тому |
Michael Yang
|
74a5f7e698
no gpu for 70B model
|
1 рік тому |
Michael Yang
|
319f078dd9
remove -Werror
|
1 рік тому |
Jeffrey Morgan
|
7da249fcc1
only build metal for `darwin,arm` target
|
1 рік тому |
Bruce MacDonald
|
184ad8f057
allow specifying stop conditions in modelfile
|
1 рік тому |
Michael Yang
|
3549676678
embed ggml-metal.metal
|
1 рік тому |
Michael Yang
|
fadf75f99d
add stop conditions
|
1 рік тому |
Michael Yang
|
ad3a7d0e2c
add NumGQA
|
1 рік тому |
Michael Yang
|
cca61181cb
sample metrics
|
1 рік тому |
Michael Yang
|
c490416189
lock on llm.lock(); decrease batch size
|
1 рік тому |
Michael Yang
|
f62a882760
add session expiration
|
1 рік тому |
Michael Yang
|
3003fc03fc
update predict code
|
1 рік тому |
Michael Yang
|
35af37a2cb
session id
|
1 рік тому |
Michael Yang
|
726bc647b2
enable k quants
|
1 рік тому |
Michael Yang
|
cb55fa9270
enable accelerate
|
1 рік тому |