Daniel Hiltgen
|
d4cd695759
Add cgo implementation for llama.cpp
|
1 yıl önce |
Bruce MacDonald
|
811b1f03c8
deprecate ggml
|
1 yıl önce |
Jongwook Choi
|
12e8c12d2b
Disable CUDA peer access as a workaround for multi-gpu inference bug (#1261)
|
1 yıl önce |
Jeffrey Morgan
|
3a1ed9ff70
restore building runner with `AVX` on by default (#900)
|
1 yıl önce |
Michael Yang
|
c9167494cb
update default log target
|
1 yıl önce |
Bruce MacDonald
|
5d22319a2c
rename server subprocess (#700)
|
1 yıl önce |
Michael Yang
|
058d0cd04b
silence warm up log
|
1 yıl önce |
Michael Yang
|
6c6a31a1e8
embed libraries using cmake
|
1 yıl önce |
Bruce MacDonald
|
fc6ec356fc
remove libcuda.so
|
1 yıl önce |
Bruce MacDonald
|
1255bc9b45
only package 11.8 runner
|
1 yıl önce |
Bruce MacDonald
|
b9bb5ca288
use cuda_version
|
1 yıl önce |
Bruce MacDonald
|
4e8be787c7
pack in cuda libs
|
1 yıl önce |
Bruce MacDonald
|
2540c9181c
support for packaging in multiple cuda runners (#509)
|
1 yıl önce |
Bruce MacDonald
|
f59c4d03f7
fix ggml arm64 cuda build (#520)
|
1 yıl önce |
Bruce MacDonald
|
f221637053
first pass at linux gpu support (#454)
|
1 yıl önce |