8 hónapja · 3164354c0b
--- a/backend/main.py
+++ b/backend/main.py
@@ -681,35 +681,28 @@ class ChatCompletionMiddleware(BaseHTTPMiddleware):
 
				 
			
 
				         response = await call_next(request)
			
 
				         if isinstance(response, StreamingResponse):
			
 
				-            # If it's a streaming response, inject it as SSE event or NDJSON line
			
 
				             content_type = response.headers["Content-Type"]
			
 
				-            if "text/event-stream" in content_type:
			
 
				-                return StreamingResponse(
			
 
				-                    self.openai_stream_wrapper(response.body_iterator, data_items),
			
 
				-                )
			
 
				-            if "application/x-ndjson" in content_type:
			
 
				-                return StreamingResponse(
			
 
				-                    self.ollama_stream_wrapper(response.body_iterator, data_items),
			
 
				-                )
			
 
				+            is_openai = "text/event-stream" in content_type
			
 
				+            is_ollama = "application/x-ndjson" in content_type
			
 
				+            if not is_openai and not is_ollama:
			
 
				+                return response
			
 
				 
			
 
				-        return response
			
 
				+            def wrap_item(item):
			
 
				+                return f"data: {item}\n\n" if is_openai else f"{item}\n"
			
 
				 
			
 
				-    async def _receive(self, body: bytes):
			
 
				-        return {"type": "http.request", "body": body, "more_body": False}
			
 
				+            async def stream_wrapper(original_generator, data_items):
			
 
				+                for item in data_items:
			
 
				+                    yield wrap_item(json.dumps(item))
			
 
				 
			
 
				-    async def openai_stream_wrapper(self, original_generator, data_items):
			
 
				-        for item in data_items:
			
 
				-            yield f"data: {json.dumps(item)}\n\n"
			
 
				+                async for data in original_generator:
			
 
				+                    yield data
			
 
				 
			
 
				-        async for data in original_generator:
			
 
				-            yield data
			
 
				+            return StreamingResponse(stream_wrapper(response.body_iterator, data_items))
			
 
				 
			
 
				-    async def ollama_stream_wrapper(self, original_generator, data_items):
			
 
				-        for item in data_items:
			
 
				-            yield f"{json.dumps(item)}\n"
			
 
				+        return response
			
 
				 
			
 
				-        async for data in original_generator:
			
 
				-            yield data
			
 
				+    async def _receive(self, body: bytes):
			
 
				+        return {"type": "http.request", "body": body, "more_body": False}
			
 
				 
			
 
				 
			
 
				 app.add_middleware(ChatCompletionMiddleware)