OpenSource/ollama

Автор	SHA1 Съобщение	Дата
jmorganca	ad7e641815 add batch embeddings	преди 1 година
Jeffrey Morgan	bb31def011 return code `499` when user cancels request while a model is loading (#3955)	преди 1 година
Jeffrey Morgan	993cf8bf55 llm: limit generation to 10x context size to avoid run on generations (#3918)	преди 1 година
Daniel Hiltgen	6e76348df7 Merge pull request #3834 from dhiltgen/not_found_in_path	преди 1 година
Daniel Hiltgen	58888a74bc Detect and recover if runner removed	преди 1 година
Daniel Hiltgen	34b9db5afc Request and model concurrency	преди 1 година
Daniel Hiltgen	8711d03df7 Report errors on server lookup instead of path lookup failure	преди 1 година
Daniel Hiltgen	aa72281eae Trim spaces and quotes from llm lib override	преди 1 година
Michael Yang	3cf483fe48 add stablelm graph calculation	преди 1 година
Michael Yang	a8b9b930b4 account for all non-repeating layers	преди 1 година
Michael Yang	26df674785 scale graph based on gpu count	преди 1 година
Michael Yang	41a272de9f darwin: no partial offloading if required memory greater than system	преди 1 година
Jeffrey Morgan	a0b8a32eb4 Terminate subprocess if receiving `SIGINT` or `SIGTERM` signals while model is loading (#3653)	преди 1 година
Michael Yang	7e33a017c0 partial offloading	преди 1 година
Michael Yang	8b2c10061c refactor tensor query	преди 1 година
Daniel Hiltgen	c5ff443b9f Handle very slow model loads	преди 1 година
Michael Yang	be517e491c no rope parameters	преди 1 година
Michael Yang	12e923e158 update graph size estimate	преди 1 година
Daniel Hiltgen	464d817824 Merge pull request #3464 from dhiltgen/subprocess	преди 1 година
Daniel Hiltgen	6589eb8a8c Revert options as a ref in the server	преди 1 година
Michael Yang	80163ebcb5 fix metal gpu	преди 1 година
Daniel Hiltgen	58d95cc9bd Switch back to subprocessing for llama.cpp	преди 1 година

Commit History Намери

Commit History