Blake Mizerany
|
b1fd7fef86
server: more support for mixed-case model names (#8017)
|
před 4 měsíci |
frob
|
757eeacc1b
server: lowercase hostname for Host header check (#5851)
|
před 4 měsíci |
Daniel Hiltgen
|
4879a234c4
build: Make target improvements (#7499)
|
před 4 měsíci |
Parth Sareen
|
c6c526275d
api: add generate endpoint for structured outputs (#7939)
|
před 4 měsíci |
Parth Sareen
|
630e7dc6ff
api: structured outputs - chat endpoint (#7900)
|
před 4 měsíci |
Jeffrey Morgan
|
d543b282a7
server: add warning message for deprecated context field (#7878)
|
před 5 měsíci |
Parth Sareen
|
5f8051180e
Enable index tracking for tools - openai api support (#7888)
|
před 5 měsíci |
Parth Sareen
|
ce7455a8e1
api: enable tool streaming (#7836)
|
před 5 měsíci |
oza6ut0ne
|
31cb1ca9e5
openai: accept X-Stainless-Retry-Count header (#6910)
|
před 5 měsíci |
Daniel Hiltgen
|
f602ab4de4
expose underlying error on embedding failure (#7743)
|
před 5 měsíci |
Blake Mizerany
|
4b8a2e341a
server: allow mixed-case model names on push, pull, cp, and create (#7676)
|
před 5 měsíci |
Daniel Hiltgen
|
a4c70fe157
One corrupt manifest should not wedge model operations (#7515)
|
před 5 měsíci |
Daniel Hiltgen
|
4ebfa2cb91
Quiet down debug log of image payload (#7454)
|
před 5 měsíci |
Jesse Gross
|
c826e57475
runner.go: Better abstract vision model integration
|
před 6 měsíci |
Patrick Devine
|
084929c293
add mllama image processing to the generate handler (#7384)
|
před 6 měsíci |
Patrick Devine
|
c7cb0f0602
image processing for llama3.2 (#6963)
|
před 6 měsíci |
Daniel Hiltgen
|
05cd82ef94
Rename gpu package discover (#7143)
|
před 6 měsíci |
Alex Mavrogiannis
|
f40bb398f6
Stop model before deletion if loaded (fixed #6957) (#7050)
|
před 7 měsíci |
Daniel Hiltgen
|
cd5c8f6471
Optimize container images for startup (#6547)
|
před 7 měsíci |
Patrick Devine
|
abed273de3
add "stop" command (#6739)
|
před 7 měsíci |
Jeffrey Morgan
|
47fa0839b9
server: clean up route names for consistency (#6524)
|
před 8 měsíci |
royjhan
|
8b00a415ab
Load Embedding Model on Empty Input (#6325)
|
před 8 měsíci |
Jeffrey Morgan
|
15c2d8fe14
server: parallelize embeddings in API web handler instead of in subprocess runner (#6220)
|
před 8 měsíci |
Jesse Gross
|
1829fb61bd
manifest: Fix crash on startup when trying to clean up unused files (#5840)
|
před 8 měsíci |
Michael Yang
|
b732beba6a
lint
|
před 9 měsíci |
Vyacheslav Moskalev
|
8a9f946ca7
Refactor and format code.
|
před 9 měsíci |
Vyacheslav Moskalev
|
3b5210548e
Refactor code. Remove extra variable.
|
před 9 měsíci |
Vyacheslav Moskalev
|
b0c216584c
Better types and naming closer to style.
|
před 9 měsíci |
Vyacheslav Moskalev
|
49a5483139
Change the order of context and prompt.
|
před 9 měsíci |
Vyacheslav Moskalev
|
6bc5c13758
Fix extra context concatenation in generate handler (#5980).
|
před 9 měsíci |