Historial de Commits

Autor SHA1 Mensaje Fecha
  Jeffrey Morgan e75c6126e9 build: set GGML_CUDA_NO_VMM for ggml-hip target (#9449) hace 2 meses
  Blake Mizerany cda6f5c66c server/internal/internal/names: validate names (#9400) hace 2 meses
  Bruce MacDonald bebb6823c0 server: validate local path on safetensor create (#9379) hace 2 meses
  Michael Yang 31e472baa4 runner: defer context cancel hace 2 meses
  Michael Yang 657685e85d fix: replace deprecated functions hace 2 meses
  Jeffrey Morgan a14912858e build: add compute capability 12.0 to CUDA 12 preset (#9426) hace 2 meses
  Blake Mizerany eed11ded30 server/.../safetensors: fix offsets and include all model parts (#9427) hace 2 meses
  Michael Yang b42aba40ed cuda: enable flash attention hace 2 meses
  王贺 25885e5335 docs: Add 1Panel to Community Integrations (#9312) hace 2 meses
  Jeffrey Morgan 98d44fa39d llama: add phi4 mini support (#9403) hace 2 meses
  Blake Mizerany 2099e2d267 CONTRIBUTING: provide clarity on good commit messages, and bad (#9405) hace 2 meses
  Bruce MacDonald 0c1041ad85 runner: default to greedy sampler for performance (#9407) hace 2 meses
  Parth Sareen c245b0406f sample: remove transforms from greedy sampling (#9377) hace 2 meses
  Michael Yang 8b194b7520 kvcache: update tests hace 2 meses
  Michael Yang 3e8b8a1933 ml: update Context.Forward interface hace 2 meses
  Blake Mizerany 41dc280491 server/internal/registry: implement CloseNotify and Flush (for now) (#9402) hace 2 meses
  Michael Yang 53d2990d9b model: add bos token if configured hace 2 meses
  Jesse Gross e185c08ad9 go.mod: Use full version for go 1.24.0 hace 2 meses
  Blake Mizerany 2412adf42b server/internal: replace model delete API with new registry handler. (#9347) hace 2 meses
  Steven Hartland be2ac1ed93 docs: fix api examples link (#9360) hace 2 meses
  Eries Trisnadi dc13813a03 server: allow vscode-file origins (#9313) hace 2 meses
  Michael Yang d6af13efed runner: simplify tensor split parsing hace 2 meses
  Michael Yang a59f665235 ml/backend/ggml: fix debug logging hace 2 meses
  Daniel Hiltgen 688925aca9 Windows ARM build (#9120) hace 2 meses
  Blake Mizerany 76e903cf9d .github/workflows: swap order of go test and golangci-lint (#9389) hace 2 meses
  Jeffrey Morgan a5272130c4 ml/backend/ggml: follow on fixes after updating vendored code (#9388) hace 2 meses
  Jeffrey Morgan d7d7e99662 llama: update llama.cpp vendor code to commit d7cfe1ff (#9356) hace 2 meses
  Gordon Kamer 2db96c18e7 readme: add Nichey to community integrations (#9370) hace 2 meses
  Daniel Hiltgen e12af460ed Add cuda Blackwell architecture for v12 (#9350) hace 2 meses
  Jeffrey Morgan 3ad4bc8afe llama: removed unused 'vendoring' file (#9351) hace 2 meses