Historie revizí

Autor SHA1 Zpráva Datum
  Jesse Gross 0fbfcf3c9c model: Pass input tensor instead of raw data to models před 1 měsícem
  Jesse Gross 0c220935bd input: Rename Options to Batch před 1 měsícem
  Jeffrey Morgan da0e345200 ml: use input context for extracting outputs (#9875) před 1 měsícem
  Patrick Devine 5f74d1fd47 gemma2 impl před 2 měsíci
  Jesse Gross a1cda80bcb model: Update encoder cache to use multimodal input processing handler před 1 měsícem
  Michael Yang 7bae7fa5ce ml/backend/ggml: create tensor on specific backend před 2 měsíci
  Michael Yang bab6f34dc0 ml/backend/ggml: update model loading for hybrid/multi backends před 2 měsíci
  Daniel Hiltgen 1fdb351c37 New engine: vision models and auto-fallback (#9113) před 2 měsíci
  Jesse Gross 854a9195f3 attention: Remove unnecessary contiguous operations před 2 měsíci
  Michael Yang 53d2990d9b model: add bos token if configured před 2 měsíci
  Jesse Gross f53f4198c3 ml: Abstract attention out of model definitions před 2 měsíci
  Jesse Gross 5c5535c064 models: Prune unused outputs earlier in the forward pass před 2 měsíci
  Jesse Gross ed443a0393 Runner for Ollama engine před 4 měsíci
  Jesse Gross 6945617af5 models: Move model into their own directory před 2 měsíci