Browse Source

fix: encoding issue

Timothy J. Baek 1 năm trước cách đây
mục cha
commit
3688955c77
1 tập tin đã thay đổi với 1 bổ sung1 xóa
  1. 1 1
      backend/apps/rag/main.py

+ 1 - 1
backend/apps/rag/main.py

@@ -411,7 +411,7 @@ def get_loader(filename: str, file_content_type: str, file_path: str):
     elif file_ext == "xml":
         loader = UnstructuredXMLLoader(file_path)
     elif file_ext in ["htm", "html"]:
-        loader = BSHTMLLoader(file_path)
+        loader = BSHTMLLoader(file_path, open_encoding="unicode_escape")
     elif file_ext == "md":
         loader = UnstructuredMarkdownLoader(file_path)
     elif file_content_type == "application/epub+zip":