From 26a923723788fe5e8331af666a5e296aff9fbd56 Mon Sep 17 00:00:00 2001
From: liunux4odoo <41217877+liunux4odoo@users.noreply.github.com>
Date: Thu, 31 Aug 2023 16:18:12 +0800
Subject: [PATCH 1/5] =?UTF-8?q?=E9=81=BF=E5=85=8Dconfigs=E5=AF=B9torch?=
 =?UTF-8?q?=E7=9A=84=E4=BE=9D=E8=B5=96=EF=BC=9Bwebui=E8=87=AA=E5=8A=A8?=
 =?UTF-8?q?=E4=BB=8Econfigs=E8=8E=B7=E5=8F=96api=E5=9C=B0=E5=9D=80(close?=
 =?UTF-8?q?=20#1319)=20(#1328)?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 configs/model_config.py.example | 21 ++++++++++++++++-----
 webui.py                        |  4 +++-
 2 files changed, 19 insertions(+), 6 deletions(-)

diff --git a/configs/model_config.py.example b/configs/model_config.py.example
index f46dad6..b9dd1de 100644
--- a/configs/model_config.py.example
+++ b/configs/model_config.py.example
@@ -1,6 +1,5 @@
 import os
 import logging
-import torch
 # 日志格式
 LOG_FORMAT = "%(asctime)s - %(filename)s[line:%(lineno)d] - %(levelname)s: %(message)s"
 logger = logging.getLogger()
@@ -8,6 +7,19 @@ logger.setLevel(logging.INFO)
 logging.basicConfig(format=LOG_FORMAT)
 
 
+# 分布式部署时，不运行LLM的机器上可以不装torch
+def default_device():
+    try:
+        import torch
+        if torch.cuda.is_available():
+            return "cuda"
+        if torch.backends.mps.is_available():
+            return "mps"
+    except:
+        pass
+    return "cpu"
+
+
 # 在以下字典中修改属性值，以指定本地embedding模型存储位置
 # 如将 "text2vec": "GanymedeNil/text2vec-large-chinese" 修改为 "text2vec": "User/Downloads/text2vec-large-chinese"
 # 此处请写绝对路径
@@ -33,7 +45,7 @@ embedding_model_dict = {
 EMBEDDING_MODEL = "m3e-base"
 
 # Embedding 模型运行设备
-EMBEDDING_DEVICE = "cuda" if torch.cuda.is_available() else "mps" if torch.backends.mps.is_available() else "cpu"
+EMBEDDING_DEVICE = default_device()
 
 
 llm_model_dict = {
@@ -76,7 +88,6 @@ llm_model_dict = {
     },
 }
 
-
 # LLM 名称
 LLM_MODEL = "chatglm2-6b"
 
@@ -84,7 +95,7 @@ LLM_MODEL = "chatglm2-6b"
 HISTORY_LEN = 3
 
 # LLM 运行设备
-LLM_DEVICE = "cuda" if torch.cuda.is_available() else "mps" if torch.backends.mps.is_available() else "cpu"
+LLM_DEVICE = default_device()
 
 # 日志存储路径
 LOG_PATH = os.path.join(os.path.dirname(os.path.dirname(__file__)), "logs")
@@ -166,4 +177,4 @@ BING_SUBSCRIPTION_KEY = ""
 # 是否开启中文标题加强，以及标题增强的相关配置
 # 通过增加标题判断，判断哪些文本为标题，并在metadata中进行标记；
 # 然后将文本与往上一级的标题进行拼合，实现文本信息的增强。
-ZH_TITLE_ENHANCE = False
\ No newline at end of file
+ZH_TITLE_ENHANCE = False
diff --git a/webui.py b/webui.py
index 58fc0e3..0cda9eb 100644
--- a/webui.py
+++ b/webui.py
@@ -10,8 +10,10 @@ from streamlit_option_menu import option_menu
 from webui_pages import *
 import os
 from configs import VERSION
+from server.utils import api_address
 
-api = ApiRequest(base_url="http://127.0.0.1:7861", no_remote_api=False)
+
+api = ApiRequest(base_url=api_address())
 
 if __name__ == "__main__":
     st.set_page_config(

From b1201a5f23142d8b0e9d167f3f66acbc26eb6c13 Mon Sep 17 00:00:00 2001
From: liunux4odoo <41217877+liunux4odoo@users.noreply.github.com>
Date: Thu, 31 Aug 2023 17:44:48 +0800
Subject: [PATCH 2/5] =?UTF-8?q?=E4=BC=98=E5=8C=96LLM=E5=92=8CEmbedding?=
 =?UTF-8?q?=E6=A8=A1=E5=9E=8B=E8=BF=90=E8=A1=8C=E8=AE=BE=E5=A4=87=E9=85=8D?=
 =?UTF-8?q?=E7=BD=AE=EF=BC=8C=E5=8F=AF=E8=AE=BE=E4=B8=BAauto=E8=87=AA?=
 =?UTF-8?q?=E5=8A=A8=E6=A3=80=E6=B5=8B=EF=BC=9B=E4=BF=AE=E5=A4=8D=EF=BC=9A?=
 =?UTF-8?q?=E9=87=8D=E5=BB=BA=E7=9F=A5=E8=AF=86=E5=BA=93=E6=97=B6FAISS?=
 =?UTF-8?q?=E6=9C=AA=E4=BF=9D=E5=AD=98=20(#1330)?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

* 避免configs对torch的依赖；
* webui自动从configs获取api地址(close #1319)
* bug fix: 重建知识库时FAISS未保存
* 优化LLM和Embedding模型运行设备配置，可设为auto自动检测
---
 .gitignore                                    |  2 +-
 configs/model_config.py.example               | 21 +++----------
 server/knowledge_base/kb_service/base.py      |  5 ++--
 .../kb_service/faiss_kb_service.py            | 18 ++++++-----
 .../kb_service/pg_kb_service.py               |  6 ++--
 server/knowledge_base/migrate.py              |  8 ++++-
 server/llm_api.py                             |  6 ++--
 server/utils.py                               | 30 +++++++++++++++++--
 startup.py                                    | 11 +++----
 9 files changed, 66 insertions(+), 41 deletions(-)

diff --git a/.gitignore b/.gitignore
index c4178a9..a7ef90f 100644
--- a/.gitignore
+++ b/.gitignore
@@ -3,7 +3,7 @@
 logs
 .idea/
 __pycache__/
-knowledge_base/
+/knowledge_base/
 configs/*.py
 .vscode/
 .pytest_cache/
diff --git a/configs/model_config.py.example b/configs/model_config.py.example
index b9dd1de..5466f7f 100644
--- a/configs/model_config.py.example
+++ b/configs/model_config.py.example
@@ -7,19 +7,6 @@ logger.setLevel(logging.INFO)
 logging.basicConfig(format=LOG_FORMAT)
 
 
-# 分布式部署时，不运行LLM的机器上可以不装torch
-def default_device():
-    try:
-        import torch
-        if torch.cuda.is_available():
-            return "cuda"
-        if torch.backends.mps.is_available():
-            return "mps"
-    except:
-        pass
-    return "cpu"
-
-
 # 在以下字典中修改属性值，以指定本地embedding模型存储位置
 # 如将 "text2vec": "GanymedeNil/text2vec-large-chinese" 修改为 "text2vec": "User/Downloads/text2vec-large-chinese"
 # 此处请写绝对路径
@@ -44,8 +31,8 @@ embedding_model_dict = {
 # 选用的 Embedding 名称
 EMBEDDING_MODEL = "m3e-base"
 
-# Embedding 模型运行设备
-EMBEDDING_DEVICE = default_device()
+# Embedding 模型运行设备。设为"auto"会自动检测，也可手动设定为"cuda","mps","cpu"其中之一。
+EMBEDDING_DEVICE = "auto"
 
 
 llm_model_dict = {
@@ -94,8 +81,8 @@ LLM_MODEL = "chatglm2-6b"
 # 历史对话轮数
 HISTORY_LEN = 3
 
-# LLM 运行设备
-LLM_DEVICE = default_device()
+# LLM 运行设备。可选项同Embedding 运行设备。
+LLM_DEVICE = "auto"
 
 # 日志存储路径
 LOG_PATH = os.path.join(os.path.dirname(os.path.dirname(__file__)), "logs")
diff --git a/server/knowledge_base/kb_service/base.py b/server/knowledge_base/kb_service/base.py
index ca8d1ae..79b1518 100644
--- a/server/knowledge_base/kb_service/base.py
+++ b/server/knowledge_base/kb_service/base.py
@@ -18,11 +18,12 @@ from server.db.repository.knowledge_file_repository import (
 )
 
 from configs.model_config import (kbs_config, VECTOR_SEARCH_TOP_K, SCORE_THRESHOLD,
-                                  EMBEDDING_DEVICE, EMBEDDING_MODEL)
+                                  EMBEDDING_MODEL)
 from server.knowledge_base.utils import (
     get_kb_path, get_doc_path, load_embeddings, KnowledgeFile,
     list_kbs_from_folder, list_files_from_folder,
 )
+from server.utils import embedding_device
 from typing import List, Union, Dict
 
 
@@ -45,7 +46,7 @@ class KBService(ABC):
         self.doc_path = get_doc_path(self.kb_name)
         self.do_init()
 
-    def _load_embeddings(self, embed_device: str = EMBEDDING_DEVICE) -> Embeddings:
+    def _load_embeddings(self, embed_device: str = embedding_device()) -> Embeddings:
         return load_embeddings(self.embed_model, embed_device)
 
     def create_kb(self):
diff --git a/server/knowledge_base/kb_service/faiss_kb_service.py b/server/knowledge_base/kb_service/faiss_kb_service.py
index 3601b57..f17b2da 100644
--- a/server/knowledge_base/kb_service/faiss_kb_service.py
+++ b/server/knowledge_base/kb_service/faiss_kb_service.py
@@ -5,7 +5,6 @@ from configs.model_config import (
     KB_ROOT_PATH,
     CACHED_VS_NUM,
     EMBEDDING_MODEL,
-    EMBEDDING_DEVICE,
     SCORE_THRESHOLD
 )
 from server.knowledge_base.kb_service.base import KBService, SupportedVSType
@@ -15,7 +14,7 @@ from langchain.vectorstores import FAISS
 from langchain.embeddings.base import Embeddings
 from typing import List
 from langchain.docstore.document import Document
-from server.utils import torch_gc
+from server.utils import torch_gc, embedding_device
 
 
 _VECTOR_STORE_TICKS = {}
@@ -25,10 +24,10 @@ _VECTOR_STORE_TICKS = {}
 def load_faiss_vector_store(
         knowledge_base_name: str,
         embed_model: str = EMBEDDING_MODEL,
-        embed_device: str = EMBEDDING_DEVICE,
+        embed_device: str = embedding_device(),
         embeddings: Embeddings = None,
         tick: int = 0,  # tick will be changed by upload_doc etc. and make cache refreshed.
-):
+) -> FAISS:
     print(f"loading vector store in '{knowledge_base_name}'.")
     vs_path = get_vs_path(knowledge_base_name)
     if embeddings is None:
@@ -74,13 +73,18 @@ class FaissKBService(KBService):
     def get_kb_path(self):
         return os.path.join(KB_ROOT_PATH, self.kb_name)
 
-    def load_vector_store(self):
+    def load_vector_store(self) -> FAISS:
         return load_faiss_vector_store(
             knowledge_base_name=self.kb_name,
             embed_model=self.embed_model,
             tick=_VECTOR_STORE_TICKS.get(self.kb_name, 0),
         )
 
+    def save_vector_store(self, vector_store: FAISS = None):
+        vector_store = vector_store or self.load_vector_store()
+        vector_store.save_local(self.vs_path)
+        return vector_store
+
     def refresh_vs_cache(self):
         refresh_vs_cache(self.kb_name)
 
@@ -117,11 +121,11 @@ class FaissKBService(KBService):
         if not kwargs.get("not_refresh_vs_cache"):
             vector_store.save_local(self.vs_path)
             self.refresh_vs_cache()
+        return vector_store
 
     def do_delete_doc(self,
                       kb_file: KnowledgeFile,
                       **kwargs):
-        embeddings = self._load_embeddings()
         vector_store = self.load_vector_store()
 
         ids = [k for k, v in vector_store.docstore._dict.items() if v.metadata["source"] == kb_file.filepath]
@@ -133,7 +137,7 @@ class FaissKBService(KBService):
             vector_store.save_local(self.vs_path)
             self.refresh_vs_cache()
 
-        return True
+        return vector_store
 
     def do_clear_vs(self):
         shutil.rmtree(self.vs_path)
diff --git a/server/knowledge_base/kb_service/pg_kb_service.py b/server/knowledge_base/kb_service/pg_kb_service.py
index 4b52625..3e3dd52 100644
--- a/server/knowledge_base/kb_service/pg_kb_service.py
+++ b/server/knowledge_base/kb_service/pg_kb_service.py
@@ -6,16 +6,16 @@ from langchain.vectorstores import PGVector
 from langchain.vectorstores.pgvector import DistanceStrategy
 from sqlalchemy import text
 
-from configs.model_config import EMBEDDING_DEVICE, kbs_config
+from configs.model_config import kbs_config
 from server.knowledge_base.kb_service.base import SupportedVSType, KBService, EmbeddingsFunAdapter, \
     score_threshold_process
 from server.knowledge_base.utils import load_embeddings, KnowledgeFile
-
+from server.utils import embedding_device as get_embedding_device
 
 class PGKBService(KBService):
     pg_vector: PGVector
 
-    def _load_pg_vector(self, embedding_device: str = EMBEDDING_DEVICE, embeddings: Embeddings = None):
+    def _load_pg_vector(self, embedding_device: str = get_embedding_device(), embeddings: Embeddings = None):
         _embeddings = embeddings
         if _embeddings is None:
             _embeddings = load_embeddings(self.embed_model, embedding_device)
diff --git a/server/knowledge_base/migrate.py b/server/knowledge_base/migrate.py
index af506e2..4285b79 100644
--- a/server/knowledge_base/migrate.py
+++ b/server/knowledge_base/migrate.py
@@ -69,6 +69,7 @@ def folder2db(
                 print(result)
 
         if kb.vs_type() == SupportedVSType.FAISS:
+            kb.save_vector_store()
             kb.refresh_vs_cache()
     elif mode == "fill_info_only":
         files = list_files_from_folder(kb_name)
@@ -85,6 +86,7 @@ def folder2db(
             kb.update_doc(kb_file, not_refresh_vs_cache=True)
 
         if kb.vs_type() == SupportedVSType.FAISS:
+            kb.save_vector_store()
             kb.refresh_vs_cache()
     elif mode == "increament":
         db_files = kb.list_files()
@@ -102,6 +104,7 @@ def folder2db(
                 print(result)
 
         if kb.vs_type() == SupportedVSType.FAISS:
+            kb.save_vector_store()
             kb.refresh_vs_cache()
     else:
         print(f"unspported migrate mode: {mode}")
@@ -131,7 +134,10 @@ def prune_db_files(kb_name: str):
         files = list(set(files_in_db) - set(files_in_folder))
         kb_files = file_to_kbfile(kb_name, files)
         for kb_file in kb_files:
-            kb.delete_doc(kb_file)
+            kb.delete_doc(kb_file, not_refresh_vs_cache=True)
+        if kb.vs_type() == SupportedVSType.FAISS:
+            kb.save_vector_store()
+            kb.refresh_vs_cache()
         return kb_files
 
 def prune_folder_files(kb_name: str):
diff --git a/server/llm_api.py b/server/llm_api.py
index 7ef5891..d9667e4 100644
--- a/server/llm_api.py
+++ b/server/llm_api.py
@@ -4,8 +4,8 @@ import sys
 import os
 
 sys.path.append(os.path.dirname(os.path.dirname(__file__)))
-from configs.model_config import llm_model_dict, LLM_MODEL, LLM_DEVICE, LOG_PATH, logger
-from server.utils import MakeFastAPIOffline, set_httpx_timeout
+from configs.model_config import llm_model_dict, LLM_MODEL, LOG_PATH, logger
+from server.utils import MakeFastAPIOffline, set_httpx_timeout, llm_device
 
 
 host_ip = "0.0.0.0"
@@ -34,7 +34,7 @@ def create_model_worker_app(
         worker_address=base_url.format(model_worker_port),
         controller_address=base_url.format(controller_port),
         model_path=llm_model_dict[LLM_MODEL].get("local_model_path"),
-        device=LLM_DEVICE,
+        device=llm_device(),
         gpus=None,
         max_gpu_memory="20GiB",
         load_8bit=False,
diff --git a/server/utils.py b/server/utils.py
index 167b672..d716582 100644
--- a/server/utils.py
+++ b/server/utils.py
@@ -5,8 +5,8 @@ import torch
 from fastapi import FastAPI
 from pathlib import Path
 import asyncio
-from configs.model_config import LLM_MODEL
-from typing import Any, Optional
+from configs.model_config import LLM_MODEL, LLM_DEVICE, EMBEDDING_DEVICE
+from typing import Literal, Optional
 
 
 class BaseResponse(BaseModel):
@@ -201,6 +201,7 @@ def get_model_worker_config(model_name: str = LLM_MODEL) -> dict:
     config = FSCHAT_MODEL_WORKERS.get("default", {}).copy()
     config.update(llm_model_dict.get(model_name, {}))
     config.update(FSCHAT_MODEL_WORKERS.get(model_name, {}))
+    config["device"] = llm_device(config.get("device"))
     return config
 
 
@@ -256,3 +257,28 @@ def set_httpx_timeout(timeout: float = None):
     httpx._config.DEFAULT_TIMEOUT_CONFIG.connect = timeout
     httpx._config.DEFAULT_TIMEOUT_CONFIG.read = timeout
     httpx._config.DEFAULT_TIMEOUT_CONFIG.write = timeout
+
+
+# 自动检查torch可用的设备。分布式部署时，不运行LLM的机器上可以不装torch
+def detect_device() -> Literal["cuda", "mps", "cpu"]:
+    try:
+        import torch
+        if torch.cuda.is_available():
+            return "cuda"
+        if torch.backends.mps.is_available():
+            return "mps"
+    except:
+        pass
+    return "cpu"
+
+
+def llm_device(device: str = LLM_DEVICE) -> Literal["cuda", "mps", "cpu"]:
+    if device not in ["cuda", "mps", "cpu"]:
+        device = detect_device()
+    return device
+
+
+def embedding_device(device: str = EMBEDDING_DEVICE) -> Literal["cuda", "mps", "cpu"]:
+    if device not in ["cuda", "mps", "cpu"]:
+        device = detect_device()
+    return device
diff --git a/startup.py b/startup.py
index 64a3bcc..07630d9 100644
--- a/startup.py
+++ b/startup.py
@@ -14,12 +14,13 @@ except:
     pass
 
 sys.path.append(os.path.dirname(os.path.dirname(__file__)))
-from configs.model_config import EMBEDDING_DEVICE, EMBEDDING_MODEL, llm_model_dict, LLM_MODEL, LLM_DEVICE, LOG_PATH, \
+from configs.model_config import EMBEDDING_MODEL, llm_model_dict, LLM_MODEL, LOG_PATH, \
     logger
 from configs.server_config import (WEBUI_SERVER, API_SERVER, OPEN_CROSS_DOMAIN, FSCHAT_CONTROLLER, FSCHAT_MODEL_WORKERS,
                                    FSCHAT_OPENAI_API, )
 from server.utils import (fschat_controller_address, fschat_model_worker_address,
-                        fschat_openai_api_address, set_httpx_timeout)
+                        fschat_openai_api_address, set_httpx_timeout,
+                        llm_device, embedding_device, get_model_worker_config)
 from server.utils import MakeFastAPIOffline, FastAPI
 import argparse
 from typing import Tuple, List
@@ -195,7 +196,7 @@ def run_model_worker(
 ):
     import uvicorn
 
-    kwargs = FSCHAT_MODEL_WORKERS[model_name].copy()
+    kwargs = get_model_worker_config(model_name)
     host = kwargs.pop("host")
     port = kwargs.pop("port")
     model_path = llm_model_dict[model_name].get("local_model_path", "")
@@ -331,9 +332,9 @@ def dump_server_info(after_start=False):
     print(f"项目版本：{VERSION}")
     print(f"langchain版本：{langchain.__version__}. fastchat版本：{fastchat.__version__}")
     print("\n")
-    print(f"当前LLM模型：{LLM_MODEL} @ {LLM_DEVICE}")
+    print(f"当前LLM模型：{LLM_MODEL} @ {llm_device()}")
     pprint(llm_model_dict[LLM_MODEL])
-    print(f"当前Embbedings模型： {EMBEDDING_MODEL} @ {EMBEDDING_DEVICE}")
+    print(f"当前Embbedings模型： {EMBEDDING_MODEL} @ {embedding_device()}")
     if after_start:
         print("\n")
         print(f"服务端运行信息：")

From 72b9da2649ca7c22d3dac11b5573fcee8be0a041 Mon Sep 17 00:00:00 2001
From: liunux4odoo <41217877+liunux4odoo@users.noreply.github.com>
Date: Thu, 31 Aug 2023 22:55:07 +0800
Subject: [PATCH 3/5] =?UTF-8?q?startup.py=E5=A2=9E=E5=8A=A0=E5=8F=82?=
 =?UTF-8?q?=E6=95=B0-q=20|=20quiet=EF=BC=8C=E5=8F=AF=E4=BB=A5=E8=BF=87?=
 =?UTF-8?q?=E6=BB=A4fastchat=E7=9A=84controller/model=5Fworker=E4=B8=8D?=
 =?UTF-8?q?=E5=BF=85=E8=A6=81=E7=9A=84=E6=97=A5=E5=BF=97=E8=BE=93=E5=87=BA?=
 =?UTF-8?q?=20(#1333)?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

* startup.py增加参数`-q | quiet`，可以过滤fastchat的controller/model_worker不必要的日志输出
---
 startup.py | 85 ++++++++++++++++++++++++++++++++++++++++--------------
 1 file changed, 63 insertions(+), 22 deletions(-)

diff --git a/startup.py b/startup.py
index 07630d9..5ef05ce 100644
--- a/startup.py
+++ b/startup.py
@@ -29,10 +29,12 @@ from configs import VERSION
 
 def create_controller_app(
         dispatch_method: str,
+        log_level: str = "INFO",
 ) -> FastAPI:
     import fastchat.constants
     fastchat.constants.LOGDIR = LOG_PATH
-    from fastchat.serve.controller import app, Controller
+    from fastchat.serve.controller import app, Controller, logger
+    logger.setLevel(log_level)
 
     controller = Controller(dispatch_method)
     sys.modules["fastchat.serve.controller"].controller = controller
@@ -42,13 +44,14 @@ def create_controller_app(
     return app
 
 
-def create_model_worker_app(**kwargs) -> Tuple[argparse.ArgumentParser, FastAPI]:
+def create_model_worker_app(log_level: str = "INFO", **kwargs) -> Tuple[argparse.ArgumentParser, FastAPI]:
     import fastchat.constants
     fastchat.constants.LOGDIR = LOG_PATH
-    from fastchat.serve.model_worker import app, GptqConfig, AWQConfig, ModelWorker, worker_id
+    from fastchat.serve.model_worker import app, GptqConfig, AWQConfig, ModelWorker, worker_id, logger
     import argparse
     import threading
     import fastchat.serve.model_worker
+    logger.setLevel(log_level)
 
     # workaround to make program exit with Ctrl+c
     # it should be deleted after pr is merged by fastchat
@@ -137,10 +140,14 @@ def create_model_worker_app(**kwargs) -> Tuple[argparse.ArgumentParser, FastAPI]
 def create_openai_api_app(
         controller_address: str,
         api_keys: List = [],
+        log_level: str = "INFO",
 ) -> FastAPI:
     import fastchat.constants
     fastchat.constants.LOGDIR = LOG_PATH
     from fastchat.serve.openai_api_server import app, CORSMiddleware, app_settings
+    from fastchat.utils import build_logger
+    logger = build_logger("openai_api", "openai_api.log")
+    logger.setLevel(log_level)
 
     app.add_middleware(
         CORSMiddleware,
@@ -150,6 +157,7 @@ def create_openai_api_app(
         allow_headers=["*"],
     )
 
+    sys.modules["fastchat.serve.openai_api_server"].logger = logger
     app_settings.controller_address = controller_address
     app_settings.api_keys = api_keys
 
@@ -159,6 +167,9 @@ def create_openai_api_app(
 
 
 def _set_app_seq(app: FastAPI, q: Queue, run_seq: int):
+    if q is None or not isinstance(run_seq, int):
+        return
+
     if run_seq == 1:
         @app.on_event("startup")
         async def on_startup():
@@ -177,15 +188,22 @@ def _set_app_seq(app: FastAPI, q: Queue, run_seq: int):
             q.put(run_seq)
 
 
-def run_controller(q: Queue, run_seq: int = 1):
+def run_controller(q: Queue, run_seq: int = 1, log_level: str ="INFO"):
     import uvicorn
+    import sys
 
-    app = create_controller_app(FSCHAT_CONTROLLER.get("dispatch_method"))
+    app = create_controller_app(
+        dispatch_method=FSCHAT_CONTROLLER.get("dispatch_method"),
+        log_level=log_level,
+    )
     _set_app_seq(app, q, run_seq)
 
     host = FSCHAT_CONTROLLER["host"]
     port = FSCHAT_CONTROLLER["port"]
-    uvicorn.run(app, host=host, port=port)
+    if log_level == "ERROR":
+        sys.stdout = sys.__stdout__
+        sys.stderr = sys.__stderr__
+    uvicorn.run(app, host=host, port=port, log_level=log_level.lower())
 
 
 def run_model_worker(
@@ -193,8 +211,10 @@ def run_model_worker(
         controller_address: str = "",
         q: Queue = None,
         run_seq: int = 2,
+        log_level: str ="INFO",
 ):
     import uvicorn
+    import sys
 
     kwargs = get_model_worker_config(model_name)
     host = kwargs.pop("host")
@@ -205,21 +225,28 @@ def run_model_worker(
     kwargs["controller_address"] = controller_address or fschat_controller_address()
     kwargs["worker_address"] = fschat_model_worker_address()
 
-    app = create_model_worker_app(**kwargs)
+    app = create_model_worker_app(log_level=log_level, **kwargs)
     _set_app_seq(app, q, run_seq)
+    if log_level == "ERROR":
+        sys.stdout = sys.__stdout__
+        sys.stderr = sys.__stderr__
 
-    uvicorn.run(app, host=host, port=port)
+    uvicorn.run(app, host=host, port=port, log_level=log_level.lower())
 
 
-def run_openai_api(q: Queue, run_seq: int = 3):
+def run_openai_api(q: Queue, run_seq: int = 3, log_level: str = "INFO"):
     import uvicorn
+    import sys
 
     controller_addr = fschat_controller_address()
-    app = create_openai_api_app(controller_addr)  # todo: not support keys yet.
+    app = create_openai_api_app(controller_addr, log_level=log_level)  # TODO: not support keys yet.
     _set_app_seq(app, q, run_seq)
 
     host = FSCHAT_OPENAI_API["host"]
     port = FSCHAT_OPENAI_API["port"]
+    if log_level == "ERROR":
+        sys.stdout = sys.__stdout__
+        sys.stderr = sys.__stderr__
     uvicorn.run(app, host=host, port=port)
 
 
@@ -239,13 +266,15 @@ def run_api_server(q: Queue, run_seq: int = 4):
 def run_webui(q: Queue, run_seq: int = 5):
     host = WEBUI_SERVER["host"]
     port = WEBUI_SERVER["port"]
-    while True:
-        no = q.get()
-        if no != run_seq - 1:
-            q.put(no)
-        else:
-            break
-    q.put(run_seq)
+
+    if q is not None and isinstance(run_seq, int):
+        while True:
+            no = q.get()
+            if no != run_seq - 1:
+                q.put(no)
+            else:
+                break
+        q.put(run_seq)
     p = subprocess.Popen(["streamlit", "run", "webui.py",
                           "--server.address", host,
                           "--server.port", str(port)])
@@ -315,11 +344,18 @@ def parse_args() -> argparse.ArgumentParser:
         help="run webui.py server",
         dest="webui",
     )
+    parser.add_argument(
+        "-q",
+        "--quiet",
+        action="store_true",
+        help="减少fastchat服务log信息",
+        dest="quiet",
+    )
     args = parser.parse_args()
     return args, parser
 
 
-def dump_server_info(after_start=False):
+def dump_server_info(after_start=False, args=None):
     import platform
     import langchain
     import fastchat
@@ -355,6 +391,7 @@ if __name__ == "__main__":
     mp.set_start_method("spawn")
     queue = Queue()
     args, parser = parse_args()
+
     if args.all_webui:
         args.openai_api = True
         args.model_worker = True
@@ -373,19 +410,23 @@ if __name__ == "__main__":
         args.api = False
         args.webui = False
 
-    dump_server_info()
+    dump_server_info(args=args)
 
     if len(sys.argv) > 1:
         logger.info(f"正在启动服务：")
         logger.info(f"如需查看 llm_api 日志，请前往 {LOG_PATH}")
 
     processes = {}
+    if args.quiet:
+        log_level = "ERROR"
+    else:
+        log_level = "INFO"
 
     if args.openai_api:
         process = Process(
             target=run_controller,
             name=f"controller({os.getpid()})",
-            args=(queue, len(processes) + 1),
+            args=(queue, len(processes) + 1, log_level),
             daemon=True,
         )
         process.start()
@@ -406,7 +447,7 @@ if __name__ == "__main__":
             process = Process(
                 target=run_model_worker,
                 name=f"model_worker({os.getpid()})",
-                args=(args.model_name, args.controller_address, queue, len(processes) + 1),
+                args=(args.model_name, args.controller_address, queue, len(processes) + 1, log_level),
                 daemon=True,
             )
             process.start()
@@ -441,7 +482,7 @@ if __name__ == "__main__":
                 no = queue.get()
                 if no == len(processes):
                     time.sleep(0.5)
-                    dump_server_info(True)
+                    dump_server_info(after_start=True, args=args)
                     break
                 else:
                     queue.put(no)

From 6c4ef26e9ac87448baa000a7bd1a7b03322d1610 Mon Sep 17 00:00:00 2001
From: imClumsyPanda <littlepanda0716@gmail.com>
Date: Fri, 1 Sep 2023 10:23:57 +0800
Subject: [PATCH 4/5] add RapidOCRPDFLoader and RapidOCRLoader (#1275)

* add RapidOCRPDFLoader

* update mypdfloader.py and requirements.txt

* add myimgloader.py

* add test samples

* add TODO to mypdfloader

* add loaders to KnowledgeFile class

* add loaders to KnowledgeFile class
---
 document_loaders/__init__.py    |   2 ++
 document_loaders/myimgloader.py |  25 +++++++++++++++++++++
 document_loaders/mypdfloader.py |  37 ++++++++++++++++++++++++++++++++
 requirements.txt                |   2 ++
 requirements_api.txt            |   2 ++
 server/knowledge_base/utils.py  |   8 +++++--
 tests/samples/ocr_test.jpg      | Bin 0 -> 8050 bytes
 tests/samples/ocr_test.pdf      | Bin 0 -> 25816 bytes
 8 files changed, 74 insertions(+), 2 deletions(-)
 create mode 100644 document_loaders/__init__.py
 create mode 100644 document_loaders/myimgloader.py
 create mode 100644 document_loaders/mypdfloader.py
 create mode 100644 tests/samples/ocr_test.jpg
 create mode 100644 tests/samples/ocr_test.pdf

diff --git a/document_loaders/__init__.py b/document_loaders/__init__.py
new file mode 100644
index 0000000..a4d6b28
--- /dev/null
+++ b/document_loaders/__init__.py
@@ -0,0 +1,2 @@
+from .mypdfloader import RapidOCRPDFLoader
+from .myimgloader import RapidOCRLoader
\ No newline at end of file
diff --git a/document_loaders/myimgloader.py b/document_loaders/myimgloader.py
new file mode 100644
index 0000000..8648192
--- /dev/null
+++ b/document_loaders/myimgloader.py
@@ -0,0 +1,25 @@
+from typing import List
+from langchain.document_loaders.unstructured import UnstructuredFileLoader
+
+
+class RapidOCRLoader(UnstructuredFileLoader):
+    def _get_elements(self) -> List:
+        def img2text(filepath):
+            from rapidocr_onnxruntime import RapidOCR
+            resp = ""
+            ocr = RapidOCR()
+            result, _ = ocr(filepath)
+            if result:
+                ocr_result = [line[1] for line in result]
+                resp += "\n".join(ocr_result)
+            return resp
+
+        text = img2text(self.file_path)
+        from unstructured.partition.text import partition_text
+        return partition_text(text=text, **self.unstructured_kwargs)
+
+
+if __name__ == "__main__":
+    loader = RapidOCRLoader(file_path="../tests/samples/ocr_test.jpg")
+    docs = loader.load()
+    print(docs)
diff --git a/document_loaders/mypdfloader.py b/document_loaders/mypdfloader.py
new file mode 100644
index 0000000..71e063d
--- /dev/null
+++ b/document_loaders/mypdfloader.py
@@ -0,0 +1,37 @@
+from typing import List
+from langchain.document_loaders.unstructured import UnstructuredFileLoader
+
+
+class RapidOCRPDFLoader(UnstructuredFileLoader):
+    def _get_elements(self) -> List:
+        def pdf2text(filepath):
+            import fitz
+            from rapidocr_onnxruntime import RapidOCR
+            import numpy as np
+            ocr = RapidOCR()
+            doc = fitz.open(filepath)
+            resp = ""
+            for page in doc:
+                # TODO: 依据文本与图片顺序调整处理方式
+                text = page.get_text("")
+                resp += text + "\n"
+
+                img_list = page.get_images()
+                for img in img_list:
+                    pix = fitz.Pixmap(doc, img[0])
+                    img_array = np.frombuffer(pix.samples, dtype=np.uint8).reshape(pix.height, pix.width, -1)
+                    result, _ = ocr(img_array)
+                    if result:
+                        ocr_result = [line[1] for line in result]
+                        resp += "\n".join(ocr_result)
+            return resp
+
+        text = pdf2text(self.file_path)
+        from unstructured.partition.text import partition_text
+        return partition_text(text=text, **self.unstructured_kwargs)
+
+
+if __name__ == "__main__":
+    loader = RapidOCRPDFLoader(file_path="../tests/samples/ocr_test.pdf")
+    docs = loader.load()
+    print(docs)
diff --git a/requirements.txt b/requirements.txt
index e40f665..4271f3a 100644
--- a/requirements.txt
+++ b/requirements.txt
@@ -15,6 +15,8 @@ SQLAlchemy==2.0.19
 faiss-cpu
 accelerate
 spacy
+PyMuPDF==1.22.5
+rapidocr_onnxruntime>=1.3.1
 
 # uncomment libs if you want to use corresponding vector store
 # pymilvus==2.1.3 # requires milvus==2.1.3
diff --git a/requirements_api.txt b/requirements_api.txt
index 58dbc0c..bdecf3c 100644
--- a/requirements_api.txt
+++ b/requirements_api.txt
@@ -16,6 +16,8 @@ faiss-cpu
 nltk
 accelerate
 spacy
+PyMuPDF==1.22.5
+rapidocr_onnxruntime>=1.3.1
 
 # uncomment libs if you want to use corresponding vector store
 # pymilvus==2.1.3 # requires milvus==2.1.3
diff --git a/server/knowledge_base/utils.py b/server/knowledge_base/utils.py
index 8cab754..8582c9c 100644
--- a/server/knowledge_base/utils.py
+++ b/server/knowledge_base/utils.py
@@ -87,7 +87,8 @@ LOADER_DICT = {"UnstructuredHTMLLoader": ['.html'],
                "UnstructuredMarkdownLoader": ['.md'],
                "CustomJSONLoader": [".json"],
                "CSVLoader": [".csv"],
-               "PyPDFLoader": [".pdf"],
+               "RapidOCRPDFLoader": [".pdf"],
+               "RapidOCRLoader": ['.png', '.jpg', '.jpeg', '.bmp'],
                "UnstructuredFileLoader": ['.eml', '.msg', '.rst',
                                           '.rtf', '.txt', '.xml',
                                           '.doc', '.docx', '.epub', '.odt',
@@ -196,7 +197,10 @@ class KnowledgeFile:
 
         print(f"{self.document_loader_name} used for {self.filepath}")
         try:
-            document_loaders_module = importlib.import_module('langchain.document_loaders')
+            if self.document_loader_name in []:
+                document_loaders_module = importlib.import_module('document_loaders')
+            else:
+                document_loaders_module = importlib.import_module('langchain.document_loaders')
             DocumentLoader = getattr(document_loaders_module, self.document_loader_name)
         except Exception as e:
             print(e)
diff --git a/tests/samples/ocr_test.jpg b/tests/samples/ocr_test.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..70c199b7c73ddb2a9ae3467d238c5547d33f5e42
GIT binary patch
literal 8050
zcmd6s2T&Bxm&b>kSwNDcMWRa1QG!Sk0RaU8VMRbPC~?6RkmwQx6%+}Q1SIF2VOLZ@
zSTYiJK@btyB`hN>aQyDB?ymk<clEzeb@!&fRZ}(HQ}0vV^LpOv)0xv{faSV@u>n9v
zMh3voF5q+?&;uyQ$^U9+MtRn#XsM_uDXHjbXsBr!=@}Ur=ouK8nAupEm|2+_7+5%2
zSkJL@aBwg}xVSmlx!Kq`*#CM78O7NcN-8=kDmr#11}66ZvYqw-thB&5*<}hcA%L8f
zjDnTybO3+?02$Spw|_bO&qhXm<|8!?Ege0>S%*dzfSinif}E1#FR#yfKRJ62P_k07
zU69kIK4;-XBlL(}{%Kl1t?<>_UJlDKyokbm|0p_oPA=~AJfdRa7cX5_R8m$^Ra4iy
zrf*<qWPIJ~)@^H>JGOStF0K#U+&w%40)v7>;GtpBF|l#+&yWe}FJ8XN$b9`KtDvx`
z_<c!f*@wFNhQ_Amme#hu{((Uh`s2{2am>Wz)bz~k92U2-`h9Kv$Hq^>&hFkm@c{gD
z_!k!$K=Dsl|3daRT&!nY<dl>Ylr(>Fk&%a-iGr1q>Vh0Ko2~_o)1z}j@=s~mucqbK
z_R<L}SmHVE`;XCciYQ`534fveBiY{v7WLmE`xmf(<(dN+Dag(ykAfA@29B)?5-tM&
zoBE)>R!bAV=b(41joGKdXSMaEf&4tHi84(<q~|`|X6p@3h6OIOterqIDFVx{<44{U
zZ`k;iiWL_&9yxC7r0KG9u{_JkX`<F>4O&Uj(MUF5af@s4i-8b?h_;mttobU>tm$rB
zZ){mZv>DF(-Yvnemr*2C`VrRq4g?hO+i{fXh7pzS7_YSJJ6A6>$B94X7xhz+5Zip#
zbCXtEMboB_C!@O<VR@WPk~!|KKyVYt7u{cgp8W%k>M5q22mLnME=FCWY>F!SCCHZ_
zT_DUPgR7AgHeA?lPK4}K#}k2;MULaly(50=k?sER4fT||+WDX9^>f$T5}a>b=zEr{
z<llPyt1u-52(L#Aneq(rN)!U0KKavLp;a37$YVvQRDkn#_}Gj}s!?R1yHnmx%!`mW
zzUj$h87olP)c{9BLI_$w4YbGm^)wwil*ExFaLFbEc7}19Z;gs30*AFE-WE4mv8DNr
zl*Ss}HN@}*Rr4p_Y&*^-Ip7vF?2b!Mc-&7Ur<H^&ex3sJi|i8cZJ~=uBlUL!9&D(z
zDp?LgOJhOk!!g(eFdnx)FbV-7{fpXT;nHv}95lANL+|~M--@a9#^hfzxyI~1SuT6B
zMGkd#NA9##7laEVv?mau{81h!>ICs9rZWE>_`^BsmW5_=^M?5^vMs7}WPeh{A|(*l
zz)5U%tonMqq^5=FRHj?im#G>r%lW)tKg79b8F!CovTo$Ot>G>^PXiphBETX~&TXCo
z=c~0YA!NW8gm^SpSW0|pV<qa%>W{Vgo8xW*uCGRh6c0wee^RC!c;2Oqr!MI^1;{`Q
z&bpPrln*Wu$ftYln41vV?}j|Ht{VIM6x?c0OC^R{>#D(D+%F~P{9fNfGs7{2xCy2?
z;q&^WaQtSU4o|*1&fW=C4?~T=k*+FeN{kQW-W9vC+cUJz0Zr`CSm8~j+h_}k(S&&v
zZgLLujFx-N84};LCOf<OjG>iU*c80)FE2Yqni*&b9ye&Z68d%3&HIncxj}PO^8uHg
zS#7C4B=$YV%1nPsa-}v@RHdF`ZQ+;0Tir|SXkm7;!wdR|L41fMxIjq7=EmaYWfD%<
zFsDGny;H!bCbP#%u}S6Ppm<Zj@p~<Ju}u<QO>Zzv1?}TJxJU<Dgy2jSP<Gn!u>M2D
z^kL)g!hGd-nI`NS34?6k`fJ}jMSoeiy1f66+P%9`roVhUMvDV{QRy{x!ib+nI@{Fv
zu?=%n#5^AmcA5>raxcp*--dub=8@fdHXZz@Kr}o8`~dC}^$470xbC=9pkB1NBuTM+
zGg;fV8?)te&Jg}!?16y5B)8N@kI^|Y2z$ck@6=Z4yQx8qglUw0bxKxze=Q-T$BUyn
zUMdJ%ehTyne0TAvDvAEMb4CbW7G!FFG(z&>9s&-_^`<H`O$uf_4{xuk$7Pn<qeDDG
zeX+RQ^X&3QNvfAW=~4z!S50uTelv9T&Gaui@Zv!hCo4;IQLiz)h%|!_p)1XGsMsz3
zKEWfl4Dro3!8h0=@s`Q__&y#+l`K?#;UCJOQU`rs)Tq20x$5`hjl2FI<27wstYHa(
zFwhvGP`)7$GTYrCxz@1T<hw%}kZ3=D9u<(30DyUD0SKl;0gomI5zJn>;b0Ih&bjJm
z2*c$oEK8oU1@K@mms}mG^}7hdHQN<Ii6+@_r`4?QDfI#P72L?{tUPq5<$?9ogYLSq
zst$<wY-3`u{X@}KVH0c16Z`1K6=*vjv+<FE->f%0^BO)Pj^vCx+Gc@^_a7>~is|BL
zYPOf)H(R5fWIWKYElL-gE3&VDNr{->ECOF0U4cJFr)^}m-92!mB{(K}O9jH%;DME$
z!!afY_vVw+=hrKki)lxJ9YD=|{@jUvb(}WQk|c8qlw2$qkRw2_5nB*~{eXH%U!@l+
z3xb?B_LA5VzdgPT%+I}EWz1BuP}O*wnwiZ*gg_CJm=n<-i@Y_{GSw#TVIw(J=trK;
z$?se1-#kc#Uo=1k^1jkh6(Luj_R@heg3-Mv!g%vvnI(4c@@tv>ZJq0bCRc85)PK{{
z=;s(kTEe3>r3o+U^hc&t)i@56LS+UZv)$Lgw<}v316kWhgsoC?@?bFz?kMF@IJStJ
zGnc=V3$#jdUl0x+w=ny*n$w+>N7dk$!o&1Fx!N=9IPMMmi8pahpi(Jn$uNqCAyqPp
zAV9~*_cTiFBh8oYMuXZ?l0KMszq@{LVlEZ6MLoW0HW_59@L4_ReU6A<+Y}M|G0A)_
z2JZY>UR5-zOsq4SXa%O?H##822zC5e8-B49+wR)fiO+j>%l;>E2e301O*#cC7YA1r
z3|skX1$P}Amtg?h51ScRiMWEj!iMgjlPW!)%*dl3<Q6YyQLp`t7RfbM8bLT7=aI+=
z^QLhaR2OgKWO4Hv=BC5f#n~o*9^M!sqmhT<*1*bhcM6S_>MgQD1Uu%J6jd=Asp(T$
zuZuke=sXI8ewV581M8oWVI9M<`a_z_(B}vroR=RZNt7UYBKei%QHC%la3v`+=?&QR
zfik!3fvLmcHz^}i*mpBu^?A6l{ZOU15*aV)kI68BOxnivn61jn+s-wKADcYr(v2_x
zYbWx)5rs&0Zc)~nmK;JQB2j?B98y)(W^^)%Q4(uWJ_*;)+2abo<FJ{$2E46%)UK*J
z2q1<asA5ofWr-6!i*oqtq;tz_)sOfO61IY1j7uJvA9gWMUo}d&uOk_WJI~N_oU%8(
zInDpL>mEe#fhs3Fbea^8opBPjT|80~Vc(CFSZbfR3^ti4?$Y%{UgtEt+Um^1__W2Q
zVu;6-*HEauki4Qop7x3^`-l8nfGiC_4}cWQ%r9KukuD#nYU-7^KU(l=mI_%vP7_X9
zI|YWm1_dzc&y<SzxjL+pb(eB@_AeuALBeC){&8}pO<y&3(?M(A;2OSX$8V)A*QSm2
zxcr_JUz!+U7b;27!?DK|)9n&LKZ9TgL-7ZLTq<2c0t~6g47V}c(hZ><+tNl~KKPW_
z+(1i|!DN%<Mm(2Da;HFl#9?*>zH_?!k8<Rd0KKl(i9LIU&%^3ILOZxcwFj8r0xB7k
zv%2m%g%1o|ManLIDN3Q^o18=AQ)9g~S+Vm{5EGRLeZ#i*kAi+pzqnWHm*tVO8gBgk
zb@sjB$^_tI!T+JE#g8ix`emRY(GAS2{Lzfr$m+_&9({gm^4aZ@h<wG3+Y>~=gk9J<
zxb-GZ1(jII2X;H+%Z>4ipRhru;y2-<QGSiz$mG;|QT_oFjOU`<DSlp-*bTu#pUIpk
zgP498a|0|PT(;pXx~b%>NI4)pcV`{#doLu%WpG|~JJORjVV0Vx@ym19F1p-)i|p&8
zp<zJk@7*l^lYV^NgAj%}_&l~7xyNwKfiUza-Du_<ci#%0irQ0j2^Dh{9PA*qqZdXV
z+n`|F2qs*2>Y^yYE&fFh&kX^wdi+-0>p6RP)d(SQ(muYWu@&yxsL_x3aT{rE+8-4F
za|2JbxrYk-G+CA7smqD6yY>St!;%7KQy(qPN%$?)Q)WAdG{S=`@gXY$wFEsKFzO(J
zxw6BeaL(L`f3mWwkh`_%CF1Kyf!|_54Re0iCSwAy+x}x8_RLNz86S`CCO>lt!to<a
zljkX>p_+BD<T#mudw}R!^Sg;^<sP{aZO;$d>bee%ce5Z&7qj=|ii-&^H`^ksWTnKf
zo4~hUCUPqoBI%(@yLtWH(We0433Ss@YTBR`zimyRLGDvLDfJA=dU6W9wy<&G+(5?7
zIO#TWEg(hTAP*tE<v3CN!aKs<ESI)ZV3e3SmVT{KTf=*%j;()nKKsSUBh*C-&xDKb
z$p438w!)PR<OnaHePo@FQCU0Rlv4}ll@`7>BpFNh=xE$}PPaZ`Gm-@x*yjETZJ@4S
z@$tfz3`)S5XEvU1sB<D+Deuz_Nr?`ApSZdzY}`8FUh?pEY6#<!Ou*6Oh@otf?I}<r
z(tXG_ElMc7Thnn|UV%`;MIf_EA`#M>9LI(1!Hz;FLn&UP&D=Zo51AJo;d=rTWHVqP
zv8f4f9<L-7aTl~FKuyQ?W(0oz-tiGza*-4KtTu?&p?dr(c{MCHxpP7{#tK#U9vdA8
zB%K7|<0^4tlc&G~=sbm46CwE&NN!-_TbT1uPd+IPViQz1?MNzDHp8wNi|b7*9dN})
ztlk+r1vW>Z$G}bM;=ftY0v?3wmE!nbRfM86Lgj2ZEP;s@>aKBbu`Plb*fo|RxsMs{
zneIl}$G?tlL7Bo;J)tZe*XA6i`?>`{d8McCPsRvRIoZ}lQ8XDmyk+*GBZi+-U+!+M
zLz`rf#rTM1EwW7(_plPAYa=1)OPe*4&)?yjn@Q(ggF5v~!fI+xJ=)jzwPU-vw!1`O
zFnb4*3Zdlb)Ra=18^N@=LT>a$a_wthQPFs-=c?}@1_fQF-~|;_-W&zCaum4^mWf9Z
ze}=t^%gAy>I{EurF7CKfHirkA=H<#4sK&TR-phR8ofsU^u%5U-I-7|dX?JseKaVgb
z<hJBOl7@JPoV-el2M1JCL@9jT$Gm^LGPGx3Ue5v!b6e?7#65yf0WQfd{>D!1)bBlw
z<Zz8hB+<!_X+Ty!W1&6N<LlFAZl;f_H0$PbCO1LMkvfTIq61cpu*gHn@DJuR;(pFa
z#jx2{Oy3+_pAVJ&kgX6a_o)t1C&x@r{&>Os#2nKfK{Qn|KUVkHBimeLCWMg0INOSr
zX4<-tM1HeP)1Cc9SbZlt?NaI%D`U=A<K(e!-j~r&?e}-6%a5+YS4=>e6{avBSD!94
zLC*p|jDA*xNq70G=)QmH!jUnOT_V)tL)9O$^Y=zuDDoUY-bXl%&7<-Ou&fwy7tcSL
zbtShd(Y?85AzlNc{HTcS>dh!-it<ZPSv7z^uTL8}2SY`~bqNr<kba?FMVlGrAwJCS
zp1mkw(_v<Pqq|biv$=__o;d~15;1Os>5%~Z+^sP!(TF~%qPiN7SiEbI?SlRFXLk(z
zL~;ZS<mEH8tn?f2%19QcPDIqN4{T^DkXZ4CDdJ5g8kGUpqs}%u&0i@GEY>cs=j8W0
zU#ZpMuUu>_**J_%j-5QNY}`LmpR+fWuV|)XZ+|wC-FllUMIln&a|`kK$OvvesE*#s
z!Hdn`0Fx`gFeXdP0GnNLPHar~Y$a21O#oMp?-A+iddS;u?mx;?r@-KLDioiBu)}C^
zE|46?!q4kDVP_hBYzDJdX7nFND5fjQ>3e4aI^2IOKMT{&Fcy5M@&~jE3%YKC4upD3
z!a<6r7yiXn5M2PSSe^ng-d<TWDSJvat+`_z7|Jw<L0aYCgpXfa=6QULAL<CowPLqZ
zbCtmEN_Qx;;+<0f%L>L8InaR7flZr=Vb@sXzx$9TFJ0(V-MJI}EGael<3)-M_x)jY
zQ%@g$nJt)g)S^bKH>axtnxVen`q=tI1NYUN1NUCuQ|D=i@xXa|PGq}|+qEuVCRtAV
zjH3<5q#dlxFh;FSp;fE)D#Nt{9=oMM^B0&y)C5_H4gkA_{=ZYG&6Wjz^A6a0qyZlE
zE<%l5rW$kPwtTE{=F;-3Nxr`Q3BUJ8>A(<JYm|eV0Y-^8Db(W1euaORn$L$j=VnuA
zT0eAMnd&gkcQ1Q{^<&b*<rsY_owD*YxnF*s(d1833Nx)mGv9Awbp|461;QDQv4po{
zw@!iHSM>y%=xQG~t{V6!4X*|1pGJsz`%Pp0E<>uC{wPa*!AN}|47w$O??ww;##1-q
zcd?l<Bw@FFc=e5znu&dr`S&%-lFQ<+g%Y@Sy9`90d}CkTkyr{WhyEIt9vO{zLxfvO
zfvBwy)Q{$i5&g@s)I4s*QPw$x?4%ZtJy?jE(~jS2l(Mouo5!q0+BKWtSeJ)294W>;
zYTO1I<WCg#GGl|7>~G<ZbEaC0(D|O@mlQS#3yH-szXi!I-eyXR&Sq|T$K-jjAd>#y
zNRyYCkKazJ4qA#?6v6w&NNaj&$C8Z2ibLPqEzQk-bn;?&ts?QwD6#)bhnv>qSA;fL
zM&KP3xY&##>Eo^L;2mEHX&6^Hdd;~`JYp&O@On9CRU?Il0Tqhte2@U_KxYkm!nXTi
zQR=}@aVF4TTXy_5cUm7usH;8VJ1qW2P+oli%Tjapb`uU}rWJ&DXj77`u-&uqJySLT
z9^rh1Qy>-*5`eoRfVQ0wPMJEyIoR#>x?_Z8sn-_q1y9p?Zd1CjXrZdyaEARkG&pqh
zc83Da#GrlrH&Jb;*xfbZ+C#!;zGr$O&wf@^6tU>MgQRQwK)BB8D^HI!JcGINn57Y9
zCHyAF_8Ur9EI;jdp?wTyg_;}fJz&ua7d%8R#Tf9?c|#()@B-~BTYd%bG06bzTR)1W
zA3IB-W29z(*zBjYUke@IFFgOv(BRXnCdl0oG5h}06=$O^f_6%WD}kI}U`=B|+l(N!
z-)`6Y2zuChU6;}^ApiRf)D2liEvGD^I`F3(yB*tg2_cSmOZYynDOK`wI&+CtY54vV
zo*km<TIaa5?^?P_(@X7)7c66{wl%bjl{L?G@g>-%*3hG?#sn6Gs(DP9&esRy+YQ@|
zww<WPz+JS6l_~$*jytiII#nZg{|wwC8y#oAN%Q>V;|axdICuCk45BH4^Md|bh%g>6
zZ0cy(EzJD%{M@T0UioIn4@QMV!!u-jKhYBm#lp^=MS};Mhi0$%8^4$2@O9ma%&r1w
zU$yO9>WA&KlPyCVxS|kum(HI+NXGc?xc7u4Emnv7Q%44M9nDQ`ft^tz#=>4m;iMS%
zP|F@{okG%W86FUd;?W-5(!h<xFW({EYD33M?M1M_4Ia<CZ&$h`7-XHlmu|ho|9n`{
zx9ffxukD@X^&g)uQVcf0SP({u`UKds3!r()k7kxx$uO?ClO@j}jnC<3D*>ARPja~f
z>c86r_tm@Pl--riISUrm%ik6Sz*uakJqmhGq*WWAEuQ-va!&W*&j++FuGhS*;+h$6
zNj_?@{j>Q~{UXJ>S2aDjgx%h<#ijCkI5M^o;^Q^#3pT<6?rt0qGq&D;_7TB;8PY5r
ziFLK6mPJP??~RTr{s)yE#PHEA2NOKQK%31LRk2S7lQiv~Imd=T*tNs=nIeUs-St?i
z11PKPltj2}(#Ss36PFUWw3Hk1KHu^n-VLUDgBmaG^>Dn%dkwv+4}y`lEi|eW+0Mdh
z)w1~1UkBR6t-RDO1+Yp+0A6_GELW|IGm5Q>&2Qlw^71woIIGd+?qq~h(+9qz)pmYu
zkJ4hD){<FTuyfeVW0T>!6<FV5Jl^+7WT&E{xlFLZBI<5%hOL1@)**cdWMHWtIumqO
z6XPQB5q!}75H?S9V);jJtVt*2c0hC&Zm7#)3o{Z^NE%2-bq4gvf&~y-59EqTj@b49
zj+OW)P*o)E%g{H2It68#GR^&-AAtJ54L<+fd$|rLoFP6nUV7hs?}<6=@srn>J-D@f
zS%`Y|$BIwPD!yt?eR;)*!XsGtWL9wMkuvFO-E@}#e7k>aGmD>?=n?wC<GBdbv!(Hs
z5TkXlpj*0*D!sYq5i<@aaYrOKl#Scja$6*c<F?L_NNyzaK7JkbCv{5=e+uB128N4I
z&cii&y968XarmpA2is1HA?ojFDva{;V_Qcy?m7z#3RL5(iFFu~Eq+^fqC*Yej^ivT
zY^>{L8qQ7g`+km9PCe3>TDeXBxlXU8#A1g;wKkHZ?fk*G*po+iL2S3=XKh7@tiQo5
zhi#;$Tig|W#QJh)7<4ufr^#d8C~u2U29p&-4$bl}2uUe8q$?fi7bTCet){BW8wq&4
z39Fl)xCL0~v;R*;)=P2%l?o6K@moz#aT=Z0S6F@1aliXbyB@pmb5E-^wa$O;LsOOt
z<`ibTKn0KAodT|-aVPSi3PC7>5iV{vL9z~H*kn=)tP2rc4X$Kl6_TK|OscK=1}N`H
zERr7K*74R+b1%b~YjG-UlK0Vi&9+s{5zi#llbF|)@FD%F33l;FEjF;+eC$_;1D1P#
zG^t3dmDb*T@9`3AKl|A~i9e@pOn`h1ikg{j5O`vW-JTW3>UT%~ZW!vIE2#)Wr7Lb-
zKd;jKme>1%RfdKUd@P!g!<CXnKMc}$3dElk3t{9Nj_l)pN+!qJrm3Iep4>k)`5e{x
zG;K(gBC?SF?3_?ywG-wz)}YO~k$b)^k(lb>b<5<9x0FGZaa+ogTlU6D+8AQyaAiB;
z5REl`R|`HV9MHxJQ8;%kaeR3&F&&sR@8&<8uJClIFP6WQqVj*?5Q}2?L<?R&sKtvH
zwu3{B+9nZBl_ObZZ$us{W)RsvKlhWq^YD3Jev#VI;B7-G7z2VI6sGCxjt@!yaY!r{
zdqIOrWTJl}wn3UHNyiK-6M93_{nP(kcYe~LI%9s3?pUt+<=K*zLD{YMjdFXi6gS5=
zjuGx349<CNvbOgs%6VNSQoAO_T@pfd(yIDSkgaQTAx!z#w><D8zo&`FvC7IWG|nJy
zOL%<o3J3QrtM>qY9>sn>-0xeqzg^cHKD^eg8V)n<teN&fnEHN=Ihn3YS4r5wtcFm_
zTV+~*bR_$@<;cB67k;r;<VOV6kY+kUBj^-BOH7||dk9?kijZ#75{d6`nohfMa!ZS=
mDSdJHzN#?o>ht-;7tzsa+dBL{f0I1^-6i+`r{kcfv;P34koi*p

literal 0
HcmV?d00001

diff --git a/tests/samples/ocr_test.pdf b/tests/samples/ocr_test.pdf
new file mode 100644
index 0000000000000000000000000000000000000000..3a137ad1381578ddc4ced057aa764e2cbb51be9d
GIT binary patch
literal 25816
zcmdqJ1ymf{wkS%1yIb(!5Zv7@xH|-CylLDa!Cit|AV6>n?hq^x+}+*X^)=aNpR><B
z=e>8|zjuuH|8Ht_tzK)c>2t2Cnl+$Q5|?CPVdO$apsWFZkP%o&nMpy$R>%na{7h=@
zb^s<ZBPSypkU5i*kvYJTlodR!!X#&8Yfj@~!62qUOUk6`<lt=Lq~-tssDMCDq%54j
zLFA1btYvJ?Kwva4U4SVm7z`jN$RrPNGBO3@BxQdgrNX3P32+5CC^-Pk01g0K6EF?-
z-$Vojkr4p4roVZ48Tcorelx=)26DCq6J(OLG<DP^WqU!VPx{w&FGK&b4lD_nkkj8p
zQ2{uDoE^Yq!Hi0RY@J?CETkO2S(9WXW%(N~OcHKRQmRfyP5>}~lqw4|DfoC{AKYgl
z1s~u(SU4?3V=I8k3lbS1SYIscq~PO^DJ2Jxi7LQJmkF$KCN+SY(;pzBf1JerILW;5
z4_1+>rI9GeO&7eBnUsTvgOQDul$)J}k%v{E6fCu^6PSOno?b9BNjZR=?Z5<o8|(KE
zCRHXi2P0cYyB9f4+?m8wnZyAumL>odDN!(XH6vq3FvuTf`$HFwq|AR++Y919)h20a
z;{<SElC%MfE)FmOnF5&P0Ji2%7No4)>@SNPog4s0Kx72B^qL8I*-l|Jn3emEr{L=u
z1X~xgDnqo_SDh*qUn$l^_^}FkID8&I+Re{Q`G0^n1+gI=^B)++EN0PEPCD`UGs?=D
zsd`CgB`md|@r!gy79){we0#g@NZ!2;twT#ygEh<HTV08AS&Y?Wi7YDjD!p?)#3L;T
z2iua}kQPr~b4;-zX04D}d`>GPjlVv&V1<6a&wPSQWnetYla|>~-nYcVuuh5zP`6*(
zZZU2ksJ8Co_5`UI6!#Re9LKi<xBgL`KW6VFw?Uce!Z*d&=pf-3x*s+Ooqi9xs<T7S
zsqf0K!S};~9|F!4%;rPN_wmOQYUzo4w9LdCEO_H<#F5J@devw4`$|6S{=>#urKni~
z6xr5Sr<y07zdiX+Mg8g2FFy9CmVX=X#r>F6osFGd!tP~+nMu^h5%7ChR7_k#LV{i#
zta>d=BU>g3Td*lCZOxfvOu@cj>EzBJ4K}i)2^hJNt<%dAN76q6Q4OSSYx!a~QZ}v^
zhxx0aUm$+7piBCDPM`E2G50d?Cwu=>HvZ&ROh){L<_puTe|X|=uEE1<ASoGfc_X{O
zGs+~c3633RW+w2Ys=K2T0Qiz7NV#8l`yGKVVmMgZIe{EVd43OSlCu5o{FU<;@ISdz
zbT9=tfOSFhr!K%rNd;hT30Al}jR-h{0A8|`vz?s{0QeI4|K#g0nEyodcPspZh2I=0
z7y$uH|Iq^Ah%k2~Wn*QM0p~|c6A@c;8vrRYlgNt=oJhG@nEz%ECsGDhFqD{)oixDG
z+~SWZ5f^h!OH*(Vv9oi5^P}4zKUi3KSbr1L`~#95tR=0#tzzY128S#Fr~zK`8%FeZ
zf?!|)r_mPz;2gxk@<JAzAzpM3j#~gLDcf(g{#9|m)7C!;{P)bpBr4CO0CE5t*)W+H
zk+S^Ls(;xQ{@p4uk^ivjU-I^EulUnx)W93UZ<YVnuO#a~dAsDl^>$55TM=7F%fEa7
z3%-9Ci<IT}9>64N>EP%jW?|&;Vjel8fAoK=8JswOr|y4}?_YL`f5!YzZtzd6{eRUB
z{+i=|8{uzT*WVM+?+uLU565KX;b!{N55bNt2C@M;sM;Bs0RFMDFo{|^IVu4h#6Unh
zknQgf0NdgB-XSig_P3ow2E21Q*nwX5lHZpDe{LllJgl5A=J+#3KF>U_K%l*sl#zsZ
z_39Ob8~6|6c^*Ox0uBZS76uv)78VvB9u5Hs3mFL!5eXjy6BUc-4GA&P8$v=-3Px(u
zx9`Xa32C@!-!ZeWv$K;>^9XRW@-worv%VmC1rHC8gouQPjEu)hMo7l`fBbp=0f7z&
zG4_fM^3_|2*XXYx(O*4xL6AT|yn+UE`@-<wKCfOwLP5j8!oedTf&psKAYQ+MgnSJJ
z2@MSe1%~zp&qF|=Lt~J!h`?Yf8^OM{$71#UoCQZNTG5WJGI~P6X6)bxkAQ=VhyR9>
zikgO&j-7*(i<^fRyctMJNz1%fRa4i{)Y8^5F$I{JTUc5-Iyt+zy19G!2LuKMhlGa3
z#>FQjCMBn&X6Jm%&C4$+EUK)kuBol7Z)oi3?CSp6)BCG$Y<yyJYI<gNZgp*aV{>bJ
zXLs-P?EK>L>iXvP?nSOw5RiX}^>@ksgIwrfxn4s-K|;a4$o1;AE4V?TLqU_Vz+i|d
z!y4IRzGd}=!xH_RRnZPl&ZcsLZR{|LfJ4E)N_qMs+HcAJbAtK(Ka%Y4g8f6TIS3@k
zS775oqC*HlT;I`Te?s{0Y(aag3=C8aae{i%Lo<XcNU5m}Od+nWbFTiE$fENqwN-vg
zb7I`769a(Wj_im1>R9^>k1&YIv@RE%Cw$(AvR(5lHV^bq7<e6^RmW+f!tk|7o=aT@
zAxC)IQk_Gs%0mg2PeDAZmHRzY&8gPKK+tMn@Vsp^r3+=XCmx7H2?+Qe*N<2sqRqM|
zc{r<g+T$@$)p~L`R9P1+f8&V7X)j|ob*>LB8$`v4iMrqz`3*994b%m>qtqUcCITBH
zp&G3Dy?)ZxsoqxkxK!Q1P13=)LB*$LXn!uTBHPX6y{tv`J;Cj9X$j}gQg*bGSSSLi
zUTH`|ubRP7)03#&f_B$a+|H@Hz=dZB%Z7V{v{0E3oY6NotD>K<JP;r*-_s8<ULK?A
z>|A*)=7(MYbvmqf7@}t{ri52FwdPT`xyY&OtPU={>DJY>#Cd;a<t3lTnQsElqgsu*
z6hS%=W~FO<$S6mBL=xZp`07}4`>BtV@9Enl80H1+buKsW3<5pZ@STrQ_Md2{OjE}k
z3EC^?O{a#>#cwPWmD|BQDZbC_)G;V6S=^`OH!Pz{GIzb=<CLgHdeZSF$J|(nyjA`r
zxVtY*9H-qlRe=(i_t?0GpBo{I#b<<|>lFLWdLrt8w(csm*z$XOu9dy+!cR4U?!~&y
zEgC4oqDrr>mF@j*cTktSRQFYz`RLn8_CZPW*tsodeV(squN*PDw40~y$3B=4VYkpg
z&K8tmcAmR6b@3wS<>Q7r)i+<<t^x7GB}loQgxdB>5T3BB);uFs<xe(}uI@@pvnqY_
z8WOG9m}BU+5wa!PsTb~)UhBFoi^g^8__Votq&i35z+igp<5Op#QkeTMWj{j%Mz6Hp
zy<yLMKrlQl=Q=@N?7j+I(aN4=$aQ1P3*zoB)TjYf=n)DUZts=A&41R{vGSq+h%29k
zin)_zQW150NHS}Vq$4Gt=Jk|g=9uwF1KCzv?{_vuP;9B9MI{l-gSM$J-Aj6hW@Qyc
zMj8rL@<uqv5&8#pLyuMLe?G1@`GMJrC9~qg4#j!1C3S4`Hd~h1s0qW@>a8{&zWVwa
zt+n@nz`?S|3@3Tw19RKeh!NPNJsmF`9aw)30*e|%xsW3!kW-o>C*bw39F%49sJ#aI
zk<3!ZIu`xb;57p0`qS#Og+=yJU72s3{olw0Ermwgp$-KQF3J@^P>+@4^4}+&Wy-3X
z=(Vz}p+vAWF-Rf3k||RZV0#q=95tPz;b->z;7ga}xs+<6`>R{3I{4{$sd!mGewU<q
z9o$87b28F)Ae8?Mv2$6JbMGi|S{}mm^<;4?$Fcy?1grKMXZM<XZWcp2zwn|gPHmKI
z3TTtnoN5eY{Mw`$ZI$Sj%(@*F5GDLbukndL?^v;I+=oyMC)aE$3F9V;KALiou;`Z;
zk%L;oj+B@|soqxcDx$o(R?ySA(!?B%0gpu3BD#$M=R%1pkz>@&ioHg&*y_9?#+;O;
zr@c28!u=NpTOD-PYpMB33&^0;mhPYBYjDB7-`ty3%?V=`hGCYexbYQC5{CQRToB4B
z(1)O%GGHe!m=4ms5f#th9UYLP_vbGmC($fwr+f^jW~etMoEFQo)Of=Y;KB<?=S-}4
zoXHaY>iOusm)N$dkK1+fPNycoG5#4sow=_c{Zf;J^$F$^*(q08sTU8Dvb&0bRg!6L
zR3<Fzg3wc6P7^UiInP8n`M4LC*WH(la?TddBJDwM2lirL6qP-O3dv1oWi_CIkFnck
z@$_nqAKYpb_YW;iQ$VY6&YpV_G3n?~Q*JoA9qBWKOkH~G;4{Qtt_({=R1-_a>{k?g
zFG+rm600|pWobpx$a;<ag_J)t*_q7QOz}r}BX?$Qf86IIFEtLzDn3I5lvrYPdJ|X}
zOEjfYsHT<HTLgL7EC!Ji9ui-UBp`i5gX2fD^gyA3?B%D2;%p_p0eM5Gwk!n6KWQnQ
z1FIY68n`b>&8ISPgC5%OWDBDMl_U9QdXQXxXn9q=i~1?dKk!;T-n_hDKQj2!#Y{78
zj)g}=oc=Qefa$1=EK$~M(XS~uaV0t-<frFE+e!Ha>RtH9mA&(4h^P@*G2pv6oz8dP
z`7wCu`5D!!O(PO0WuT(cG3cy{jZ9F|07PHf(l)x_3^_Ft8n+XTwVtR-m0n3;{a<X3
zt-MY3-%p5}+%4HU?UCavrQQ-^f5?Z@pgfF7Z3{E4d75acSp3?x=IP$Y%9Z>K!PNrc
zTCEvsfvf5kr&cji$}d&aQ=rp&sIg+zy_SG>C}iI0b>F-H0LinBedzBijQHOm9*j>N
zfH*hHa8}-ei97>VvW^w+VWE6+LGZ}Kyv98<gndx9TXQZjY$vhU8#{s-PpCROUKlbd
zvai}}`?G&Le!2XlWDzjwo~&eQ-E9Gco#L``F()!)e>Y7p6#SrWzlJDp*Z(#5u^NQ%
zi_oz=IdW3Z_VyEh#0C4SaMFfJAkd4c)QwBBX@Y@41w^&<Xml3javTCZ;N?GBJa))n
zTv-(~1<^sH^w!q62XZ1q=DLhYW`y4)SKo>&(`LlHxh-=r!<{sZ8xqccYgNq-cDjLM
zX1C);tLO3C)S>HeGSDCHF8u?S0E;lrPIeds&3~~CO>=~UP<N6%YIb7gb$*)0_3PCN
z1lrqK>y)&zHBKHq2(5`%1}!oi9GXbXJZf)zc3r7e7~%PWzvnh}llu%o(b*+*xwAZ=
z0SYNIid%c9<CC+7_=T?Xo_a_b`+C-2c5A)NozDVN;kxJZZY|r=lAEJp&>R%2EV(Wf
zwv_7iesP${J6gJJ>jI-pk2A}ofu~nD(NG>Ga|vI{Q;4d^7TlMqXGcSjm$w)U3Qe9N
zNbf;+8*P1`-YH99LHwn?3S1My6kF}CIDf}fp4XDu8$>`M=`gR|78-AY;5qK}5ks-q
zkie3kr*!uR8Ho3aCXp>_RvT~o<WMUU4Wz3$$xrT-=*ksIT+pRESCm5XNUVGoMCw!1
zmTi4*jVVjm2veSSYlX-0pj`0LsAfJDVm`b1yc4)KjBTM<&=xYU(A{;a3&%j_y-H!a
zNVO?2O`r*aETqaLiMW)_d}UGhS<E(dsnCsmvM&zHG1%Glr-K^Ymx_!ZO0ZuwOsq9_
z*R-n1374%BM~|^jIBhi5$a#hw*6T{`eVCKFThULN=W^RZGL`5~rD*D_1LZ`%sV@^x
zLKgm<LhdAXD-CVi_&)OtG4p!;8R9+JSCnwYwx^LOmwU>|x;T3ZyoP8a@5nljyBrfb
z&#)!~kWkoV2tPxiLCuUJeHYt|!0IRFsv7NC*F#8Ht52*;4LoJxolGC!jmhy#0n05}
z#gQ~2Bq_DodLPFE06lAP$HH$sU}`{X3<$%T)iNqeM=TW9%&&f2x07F%@}6ZvShmu(
z+yK5UXzxEm%pTOX?Ic#{biZZBpWmwT>#@hbeZNBJj9+%$k=pMT-jQnX{WN5wsa8fG
zR>D~DgFsa(#JFe3+f+P?RQ5z;ap?g_K^O&CFBB`Qa}b`E6&DFsGgac<;bQiJgog=w
zC!#wvx!mDGFkjWs!M$<m{uA{*btvh{Mk{soXd(f2ef<Pu1pT{#uA(B?Teh<*mN`!d
zXb9H{&5WH4icIy%OGPB@o1$@*%mWhZ%1NL&E4#VNPi<@;QT4D4EK{y^6&<&H&FQ0(
z3j&FIm<k}3bHi&GoZbMtv><}PC(Osio`SC^D|$bsfmT!z3vc1ypsjlpQoxXx!K<(x
zfH`L1lAolwX)5<!<C{R6o8x&6C*+QA2^aBnd=w=qNsuA$0ffL(miU+E_{25FSaS@u
zH>VyW=Im^162S+=zvd`*G%<00TQiwkJsepCh}61UF+VN1)D6G4R=RV^s2j(H=$d|w
zhMVDv=3ReXhNwEhA%tI>lQq05LbR2_Zc8bzuA=LX?<(~UShYV~f%U3tod{R6WwfkX
z2z9qn&m}dosnedn60bSdZD>-p$^USyafkd2xE{_kljXSYt4EcxmWkErO%hz@C79Hh
zTNCfNp!d<@E&c2FLELimEGqW;E%9}1+7b+#mGgScx2xJ-Kk|i^ehflrXNS>1{G~yD
zJ}u2FW>^j`zbIw6q#i$>bN?Wd6B(9lD(AO>QbM<sP`W=o=O^O5O5eh};HR@D+e@KN
zYR4R<o0;q6qy)>g0%SawJo(0{d2-8z=;*Y`1+#iY;miXSrSAJ+onnY$rQ!2xEIXmJ
zl*5}(%X40<%v?Rn+&a`nQVa8XOb^usdskgdYwTUkBCEdO6B}i7vJgEs;DbX+2@et+
z6uL06^C_;<DNgZ9%4(8G-233+T1@t9^!H<N>_#dq1SD(Z?`BqrdCEHE8Bbd&=Jq;B
zF0jU^YAsz+C@ix-)DL;kZsV<`fmU_`2b<@js*0_Ofp7bvxT?q^iG22r&|T5zT@Hvn
zrsahRCF4xi1Q2B>-b~B;xdWydj|}Ey)Yxmsq`UCu`NSOZk&jSlMlL*m@mtL8j7a)}
zt~mWHyn4eIrS;!e!G#*e!?aTiakyN(XheYZT;hZ(GH(y<mdj<Toif@ESh|})LDCWZ
zYBwpB$(J3-r4;<DskRpWou@w#Bv(lKggvG#Oz0YRv8eilk%_zycA-1J-RwP{((D8b
zQA&wdzAozA^y3110#fpmzz12>&{B3lE3O7D&@-REqNJj-0$^&!2Tzb9y#OnU>{6`+
z%LH;R57!sH<>!E|`bK7R(7f|-YkJ%=Sxa}Zg5gFzq9G@UInm62<*}9Cqcr_S@g^;D
zRd6Xv^1zl9l0<EY`D?kyF*u+Y4xGKI*C?OLf#3QIw5>D}Pm+QxMt+P|ZQHp(MKB97
z`XtQ#o1l3KB<zlx#rclut0%77PRd3^{rAgms`j>nX9>eF;wA}1?M6$DUo0=3#wma(
z^gN(5{+ebNt;b(<@N3^~_-URYY{GR;&Av6}KDG^GB%B>GpqAJ_LwG*c{<>3w6eOXY
zV4rWplBZB~F6(223+)UsR<5O~<SV)a--D($(QPn!;cx287rAMw#!0lK-^P|$P}DRC
zmZPsz-}n0ud+b!_PH4)1vKrGBI5Ax2C}QntdW`8xg=qS3xafhF7d<U`XWF2v8=jrq
z#o6~p@)zVM>C0h*$?Yeh(*c|(=qcltk(y!=S969E6-8TLubxQ1ZIq9_<<hQdlCB?$
zawy_HLAx7<;@u2Op5lfuD+K0QYF6x~5b6yW0X(Cxh5HJxO@xVHLf7k=E@WlHQBn4*
zbn!aKdu-AamgA$_X8eQ@_DgJ2uZHM@YBOef*)|qvG!@MtKHp8_=IiDAb9C1>*%ODB
zF{jR%tpbl`kWVWPDDL~8rdAg;J%ypMl>f^OpP2OIGC$NtrSD1ivlRvEJEZ|-bL9ur
zs3LEH;<QskKPMuwj=S;QJBjAG;F;W@SFp--Kh?1y?3hI(JT>(T4ZrY?EHET2t|GxE
zSovmV+)&sX$mZ-jF1dk}{HBOh+HD`y2glZgVs$4qg!^VuYeLvxE$g_UcFN?**v_%P
zvIRDW2lDX6uY8`4QX{;2Tg$Hh78y~xZXB4~kcfwC#W65Qzy7%X(5RWAr>`?_rDS==
z6x}`f<8zi`&Bqe8pKF3X^GWCBq9ZwH)w%!@(2fEJ>>~FsY7~c$k6K@m>HZs@XfZ#i
zdKYT%!Uzyg$z0Oc;aqKy(IRp^)Hu$nnclCUTy6@IoXlBxP()gL+5yMA?dAlUgB_Zr
z3f_Ke9jpd&@Au?-Cb(Z_2080yqFQMbkXJW>Z?R(a-!Ci_()86CSYhC%Gee$#Mbh`U
zG`)$=>L-aR#So&qDe(pNR>St)!XIa3atSd_wTLO!hwUr+S%An}MC<Rx<#J8Q{d^2~
z{l^+qzurVYc|DLnLwsWWc&a|SQ+qu%=N9z%4nxAR#>T`nf@$P>$O7_x7|qw$|37M|
z&$Iuws>t%!vZ9EylLg3u#)#AiTmcgU*J;5;HJYbq2zdxg2oneg2oQuLxS2sXL6kv|
zLTG~f4iKi`9xDVh1PcV`pNlL(w&LJN_B7(Wtjw%z%p5Fi;1d@s3q3P8H8V3c7)%~y
z`oDnym%mM&O#uIA<o{ZtVf~kig`%;QsuPe&fs~c`kCG3#*v|52(c#||tT~u}SN{Gi
zGPtFGQIoe`XGUwm^_cm{+_M<h`T(D+RLh|MUMvJsAV7d7Dm8gd!w$>hWBb$o;+N1(
z_Qe`h6gX?iGfxovo5=VdB0*@>q|hOxFri{AIsqC8tkAilG4N3Q5R{}L+%zbwMvxs8
zP?Tf{_NX#w`L9FJ^WRFt^^nPY=JI0?6<Jv+ps=GU6#m8yOB0Y62BoK8K^xd^^piCa
z=sdV}tlP;tec<S-nHsjZVO!qc;O=Pn@mbr)-Dqoi?Uvws5A;dqk34H7sJ7PDX1pF4
zhR_|#)eO@+5=c>sTsujbu0mYm$Z(MibTNLKj0j9k^N@V8wXkSR)Suz>EHsQgp~2=M
z#UiI4(%qbbZtU8f>+g+QKyoD9N1dT%N+4isx!j=#NVj^ExMn=7`9b17{=QQcl^bg3
zR<V97l7-EhC~bC(f0w}-MkQkpM%^;W1FAHJ^mxd9;me0D;z2$*Mek_68s{MS9Y@V_
zLBjWEW33ef8&LvyEv)j^n0ZwnCjiQ6HaWDSI`xI0MVdOMmOy%^*`wTU!?o`EI`?;<
zsdZ+75%yT$OcZ%R2cgg2{>zxpwIjLuneR*i6|B_HwY)d;jiZyNZxA)#T#XQURF=CS
z?k(-9rcyVuHc9M1ji-C1ouEz$5gB&1rbi{YxS!%u_?M;s+mQKP7yq*)`oDPJfrIU@
zH7d7seWiY@PG+>`efq0pV!wA>E{<qH?7;S5!Gbi@nA{rr0!p%e*k^A_o^K=2@IkXF
zL_rzz`BOU(7oEDZMxR6oHtlP}li&oR=Fl`gjj`$}KW$PFW+^X}I{ql+@TW|Ne2my2
zd_ZW5s}xv5zdOSA07}m259xO;t}UP{SiHviW+}Xi772dTjfwesu+qEuZFy&7bZT2<
z`6O99eicJRHG(-cg@=(OMRUkF#K+KaH1<7`k27kIq-}xJ&HU=l3uVN`!9gdUKVxed
z@nv`H<n;83*fbM{;U_n@Je{R+RnY5h98LwPhJl;Cv?ZKw^b^`iYP*lGsYqQb{=FXm
zT9p5v>yd?plNDT+{rwUN_|+L6c5WWle^%^4D!iAf`rY-gex(zr@pYE`SPYglnap@#
zqNtdx?p!5SV~kQ_o@Jvj*L-E@4D{@4gs_N^KGL_@_225{l+m36UJ;2a2^(RVp>;!>
z5<=@qKMgm?(7(MK8sIxWJ#T&9zTa=SKInJM@H~o?#uJrh)^i)<FVxDsnf=y-6~J5*
zqiY2E&S7q<@fgVrYjGFrZIH&=jpZ4@Og)VGc2Q|jZ~VmPDfdGMVYM(dqV*oG#(Z70
z-^DD7C<TEvQEkzWXv8-ET0>#!!oY|XXUEK-Cs+{=C7{^6Ux~+Pe~h4T@?+Xw+Cl9M
zJ&P3l`K_?1U~7JR?N@gLp!B==X#cxD7^$?weZFxvIL{8z?P&{ZyKfQh9=Jx)^>FB=
z7PeME$LA<Dv0FHuwubJ}W;0I{G9!g%SvXvg9i5a_bVYAa<QMGNQ{>OG@S7`9KGgx~
zjSnh`_ZKywM->WGF;>6tU5N2vxD6ZuH>Lh(;XbsYiqoU-vUp0@r3q#}cf=}XQ`3`H
zQn+QsblP9DT8D;6yMq!?j)^*u5^rR+B;~k+DpS6DN)on4>M(?947^F>i%br!)H(j*
z?}qM(kQxa0#fN(DVko98;0wGF<82HnoZtVw<E-rsEt!1VB_SG=$bURG3?<%6AA$s6
z|30;`4C^z^@L0P2iL?#s#{BZHbAJc=e{tt&IhaGVmy&w++;kQskn|Df6xVe6V=>4F
zvf`QVa0a(`>-j|OMGYH<fs}+sE5xr{Ki1cwXQ;vLD)p|)5T*zhNrwv-ds*cUR5a@x
zp9&YAZ8ym8H)BM4_pc|691p`|mDP#Fh@4=0kTauLdf*&kHfQZ3Efj;l5f*ftv$VxS
z1p5hMSNOhp6>%XkkbhIzLjI{FO4#4xJ5@O4DRyS(=+mrG<uyCTmk6#^S1-5T)JoJb
z>M?&@TBw~$)J;u$L$J3!P*z-8=%O}D55%rA8%j119JET&(a=%hZ?G8af?r2OJnPxq
zM9~PiyQgGceDyTDXA}JV9ct{51Y-1)5qyMf`e7_wN|_9AZa@EQHeI^$FMN8<!V-s?
zK7h+<D&ZR&bp=n5FLvW6jS-wins*ww3K?d~Tio;kqP?`YGJU#&+2sScjuo?%IGSZB
zD$}{=0ZxVv3&`EKE!|eR;aEIh)E5KBg<G|k2I0_^ujuGYx{6%X_a^9Sx?edr<x(iA
zt9(YT__2hSGvH60AdvM9!_T{@G5EAQPg}1q%xa&zKwc|S_J;n5?AIRjl3Spxr6!%e
zab#m<@0waeGD6KlQik!Xa2C!6)m#nQ(kbHMVn|D14Z@wVj7D9mHcP|&KnYET*(|hY
znVz!o>@QXu7m36gPqcV#7hm&~K)uARF}YNwF(_Ko59ThFDp{>wNhvWXS@F260o6nr
zWE(P`=Xl1)MlJ4HOTN_|!e(wU2LjD?T?@Kt!Tg0><zl^<5PY8w2cO<nO&pk`nEGpd
z=Nz1a=V9s)TknZ6hfE=rTtY6*gPRqQld8+qJ}Mo3#WApiUq<t2zcXf;XbuU_j#<X6
zgagnLRp8=N&VL#uq1OFzz_U0Yt{=D(mrf-GzqG@Ot7|ccz~i<tV+21z9*<KaR#xjG
zCC;7Z_!ZW<PQIjcgr_A+WKo1D6=kT)^6YSL0YL{co#5$=tluE7#7<pfhqMT3(0OaD
zrD}AJq9_e~WrkF4BpEmQ-NpWEzu{r819U;v-FsG<ygG3?S&F@PxR{$YdQrSmv*kmU
znwox@$>Hxf&a8@&?_5$QIdRK}VqMQE5StrGAj5lisW6?tr;47$%QR*?xW(`EB`9ob
z0qRnw=MFeiiHl#$a(hecRhX1c*Yqm$>YJstytdlV3hX;+7B-8T%PV;u*Wu8v(QOr?
zkR~}FFIUA4Sv;X`#au9ZP~Bd+`Myd0sCo_>Qp_{?4Spi&-6_&35!pL$R*oyH`U@Hv
zKw#ronn-3A!MT;~KtYhs^mZZQj$OwW^rNBI&I;HQU)wb{*M2mp_0bhi3rT-Iae6kU
z+-iLPenvIR(R`<O32R+e<n>c}S!yPg^?hsuyV|G8AW!e^ZtKEwZMCvl2hA4sY0d7f
zy#h7fgseR$juyDcbBhAIP|`7@x>0g*Id4=}1X3}}La5_F6i52>7Gl^zH{h~#ndG8k
zV}O4&t#6h#vVK%?j<mLsx`vuCBR?Ho!x*JsQ{|lGmvG`JiKR=dc6em2v?{zg40<Fw
zSDBUcvRa-AI&M|6VXI4>%%RW0v!9K_!+XCd)Qorkz~X37!f%{z?3(lP@NYBwGPm_f
z{@Xe&5G4!9D5v=y<xoB&M?*Ucp%~o;KFEK(AlBeO;Y4y8$!$*jO$ysUp`4?R0R`KN
z)<(@$B?5PILROz%?)OQ~6H}`IuhdFWsiiQVH#+EZh#z${{mVRq#LrElPNu(|Ya}AH
zbPVKa=}EMxQ*@As+m1HO?4T=2;||ODx<WA7U~yzf$DwX<_-p>Mw9XA@sJN+>vdC0S
z>+|Fqm`8F5$cbxhR%<y&J{g+kE6}<@#Cm#QXDo!_oa^o+Z0^QrOegsQvBqo(B2Y*!
zbA5#toE6`SVMK=A3RP|oXMNUM9e+_BFx?<8@88^0RR_0}if#3#M1!|k4KJh?t<lAU
zFK-KDydy28gDdu$>C@9DqHMk3yx~n8oMRqfi89p3$}RKK#r+DSd{a%ZV0c8G@me6E
zb$f`+byCM!eM!T38NMt46I;Rd-gGtXD`5sq&HLBec<)Fu=yHp-V2_cEfc-5R3?~^V
z6Z9#19KWDR&LpI<?9nf|gACyKb@uETabmq$E)^1)RW9K?&Q+s#%<$pUuP&GokP!m>
zmn_Q*&RP}P`%DA){e6Cf1V&zAUbzqpq`rUmmIs8bC%K<me(qjz&8s-ADVQl37i%E<
z-ZG`CT#3SoYk8kQXW2PJ!DC!QVONMNd7>_jQ79`SLsDnA9JSk>tKdhIK6FXl_UmJw
zR}DH%<1*2;NBHd*@W>N=q(Vq}i7;_;=YtqFjs$YKAt(&k4gnPWwivub$F-KPzmj6@
zweC3|LeL-u&NkCsPx-a!p9~5qPV3HFLnYU>{oLPfH8!*^cO9D61{Ybypw)imwqH{~
z-(-yaAW-l&yj~KxytmA1EN8pR*1W!yR$Y`M^(s7bK#wR;5AtgmgZ8vCDvEK*b7jLQ
zE%yu2_`tENU@m-os~G*Pf07~{peStYyp+7EgLMDOlgQ~DV>hxvM6?!^<bQX>K7P%8
zW8U<-a`zh1o9k8?77yjV$u0AE09}x}j4dKYf~0%j@m_ge)+0KAN*^?D(4>wSU0r^N
z+(4Pw9V5$76WuDKhqNG}gN^K9#cRaAw=U1S+_Pug*rYG&s?VESiPBnCiGMTahYKL`
zR;RTD7HV*Bq@T2_npeSZ$DEktka)?;XBpO?d?`awXT_)JypNMOyyt*8hA=Ss6_c;M
zy5H7wzAIdOU0}RQiJH|_s20@swYLz-KNGSn*U#M>U`2+yv}Rmdj-%hM;>O)_Ib-AY
ztQF9yn1PsCpkQ96ld@l8H|N1mlrRCGzUb?F;;c)S40pG8+Fbwss81j09H=qDx_e<w
z9qbb&N9z=*$XEwgzM+$LeLJ95{NZzDE3ZVG5|R%KRm3&9dUJfd=y%Z%ZY*7tF;d6I
zz5QENE;zJ9(Vx$?H|U@e(~l!hkyuWl_I&;A4KXlXKZBvqQXXis-y-<13t5>5z4eh}
z{-#Ry{XyCXY8RGr*G@6O^NrAJ4<QyRlrbbjI5Ltu`cFQ)0wi~j#CMM<;A0IJuG1Uk
zl!-KYNhr7?)*bWLr;J#)@gchIdKNlqw&n~Hl(sQ!epLF^uhb|yO<9v17S70P%c6>!
zq(0bZJC6t(-tYMr+(R<CJWJv*`NQ7oM;XVKiLoeeE6a@>Dn(2Ws$uQLVnK`XVcm)e
zgxT8-6Rat3pwOyrAdS-hM8PlUC0@wxeRH53fxnQ&j7pr_8*xn|X)O?@{3iOXSdMxG
zp_BAy!QLF{@N*i;0)a5KNnVMtz8q-{VigKn0R+_&sn2-xS<F8bRPeBf0}Uz^SonYD
z;Bk)R;Kef@3+WSasiIR0eN#d{p^1MKK#(XgKquH#?h^OJf?Q=(+&9!-ViEwqumlk)
zF|K9$98usr-oas%%PMbSnanZq<{R=mY|Gm*VR{g9Av`1U$X(L=>NORrz<3zl$3bO{
ziUh64>M<3C{>1mCB?)Y45(A88478)zSJM0|u4CB_xK$mww0W9039A_8cAv*AHxq4x
z8u}YAhWKRUG_tIL6#!}}QUsC=n=4aUuHi)hC2#ilZiphUVe@sL9yO?uYg!lgEm!1a
zx3}_`tA8SJI^S82AhPZ<p{~}wC#cQG7#1EE7M%zA0qZSwmtz@MJ<l+pmjv!KdgauT
z@>~Y8Acb3)y)|YgPz{=vQvO>ccd{ERtTCq&Up!~bu2N1$b&P}(h;gDMIF&Q2EFmwe
zH9;+wR~lD%;8jhDl7SReOrhvJuLI&mz{~ARZ~5C)k>^1vQ;N@~S$2=`3z!ss3w!qN
zt)E=)oHgqtEvzYgg$^#f9!b&$##&uniJJTS17{E%_?mC0G44Pzj=geZ<t@k0<|*=K
zr|M2eLbplu_FR10=FD$)+7i5X8h+S(D#wTli1FQG4!Yjf!Oz&#X&Au~Y?k1hz1KHo
zW=&5;j2@?=&P~S1c}w0k@E|NTl6<p)1@y8i;@-IjK2(E-DSA*9-bY0%<_T~$pvu;U
zN`2P4!NE6+!poNF`=w0Bk+Qq{Mu8C(c@hnIbRS^p5jQ}g*TRB{gpJLhOqmx(PEMXZ
zN&D*;-Le3!VBfc~pKNs6@#61BMd?^LC=K$$;wTWIX$xCvs<9<HI8^$bZCm()CpTyP
z{4`*_T|cfAef@eN>2h6$aCA}=`cPfjKiW97HsQNIYYk3i@KrOo+RvJadh{}1*jgjT
zzi~9LKZPyw*l)?57KGhZ{-_wI#z~Z?(Vo!em{Vb{D0pXQzjwXA80vi5_(R7rnY}uq
zf$zJ(cb1lK0tEuhClll9G1-X)&Y3Yb*yiomy7V$E{o{lFcO2~1awE4AY=njcI{nGk
zgEeQniBvqJX%~6ltJzz8g5L2CLiNfS#Pv2KYFK3#o=)1I>NpePiR2ltlffRK<71bG
z`C-ed8I95wjw;8((cs8-Wap^lWNXiT%F#zcn0BDUSNl{u5k}jhfhGIHhcy8QDY;J=
zGc=JQ`Qu1IKT%H?i%Ab`*yDq!sJ|a1!JCvvgxxYYPPySA)}+Ywey5|5CyDD^Aly1E
z(q~1(RtMEq8#N81$hMtGe}N=NhKM`sdo<UzB^Q@vpqK3w>_Lo#Wf2<r#|H1a{O!f^
z2&eeXGo1dPrQ>z>`FQ%`&wWN?LuM%fm{o-NAr5UFHnaJdGTpwZedmf*?T2I~p3l4F
z%L%vPl<ms9p3gfz>ex3=-=B`y<hZMLa;fE6<Ri9_&7$vzDtKhiVi$@ePI;fRLs!>6
zVQjU=hSFcC4^VM_6G#Sd;?{t^%tE5FXz#UB%%a@0#dLjk!#E8_D~(^j>$!rxMuN;|
zSH8zoU`YOHZjwm;w!$<fD5O9J+A%OVu(+chcM&(!ZCNW;K*!0#)b@zxn%XtPh?7}S
zt!NQ)fqH>@@lgd)YfKQRs@P3mM_ks#X+|6OGdV@5f=t#=o6`-xWN7E9>VEe0mqfXt
zvmvi~wju4E)6Wj-!(gACVR06PYu=7HtLsb(T?vvOpcOs0TB=wcGi_73PeSH|Tn=6t
z2H2P+W)Zum2OI=`Z-3%<gmut$@ODfEg(68-Rdm)*^%6+BMCkFwjz^mscSMk%pGm&y
zG#1~h2(;4rPW$dnGivgy9aAIA%4+tM6TMW7Lh_*TZF*=MwDK^lBP+Kz?fx*ies#V{
zr$~qfi5SF05-s#}I(Zmu6O-9l#_3S}NX^_j3BBS)v6jh;%<nJqCmK_$t+5B<$cu`{
z7AcE~Wf+XU%?Haw6CEV4YBVu9m67P%-7axF-tJWI3>q5J58w=5nQK1}rCW=IX^hP@
zzr9*NAenMN^wDZ(_+T>UKl91u;}zZhGVz8W#*aIR$m$z=*1Uno&PF+Jcmk8yzSsAf
z8EjSIT1SBmvq$o@i2i;!sVS9jcV-rScF=NWS_m@c<A`xpQS-T_C`|3RK3|-W5BeYt
zGnYtrRWUhaVrJY&nVR{<{aEeZ!DOQF%P-);OtJ|xeaC@reWcxw6wG_5TQ}zT0lzM-
z=Jt-@rdfQTqU45hCy?yz5#29#Kq}rN*&`W<g#9~aafe1D$@k#$4Hq`x(WD%~#NwuX
zsQgHH`nN+QI289#Me?i@6Sl#F;m^|exM*l|hEtv1t#Q&~o;w$EBOtuRPIgI9<JYzr
zxHzm|u`1oh@Hu85__E&utWw}n7USd9eo|lx&__imIBPC#5eupHI2<;m0PXP~ksy;{
z4e8dT_K)QHwVwQwljd#Zt>y2ZWR<s3$pFzQp#F`gQ+>WiSKVR%h3k{42r4U;GcUUj
zZF(3po%@6Bv05{bp#gD$fq`~UCZhG{6ah^zwO^kHb2IEd_)2TRL`pf>#uh>X`Z}7K
zU?fT8^NAZt2$^Y-41`CifUNJ}mk{SnYw!r8<s%`u<YW~59F=XJA9k97h5XZuEt8of
zk2ec-LON$7c|?l*wa)vU15u#lnX|oBkHmYQoi)oZmhx4}A=V%-x3f}mY6X91E>FFK
zmIZo>bc(}`u2tqsT<Ndk@2D2=gpLr>ai&9r;L-DT6}jZ8ZG>zH@o>y=8Dzt_BqUN*
zRv7S!WVSJAJr_U*5JD5P%uX?!hgVHuTGtyyk%&okw}a<=r)M?C-p3mdtgiz_vy^DC
z5dO=j$MR|0zo2;pKWqqnK|S%j%^Q5D7}i4aUncRNVe|>UrO)SL8O{7IsrpFM3GRhx
z!Sefnx8zdrQg}<KYgJ@!>qzi{@mxc(9~{z{hR^|qf*<wu#P87anHXEkN&_Zh8Cu=Y
z>ikag?P;Iawb0DrhL_jFuOp%Dqr@*Z&!;DM2@uzqaoPrPucH#=Q>EForFEo<3VqW#
zS(9gep(R`6*b6V&z(p!$Q#2?!GIkY{wn2~ad?Pk?u^4?#8L2d^phK2<#hp$ObE>2Q
zT_J8vDp?;DI9E-LI8iMkCzB_vfPA5ix{ISibuo{SD=%7zKKJGqTyjsx^NLM;_b6uO
zyQtcqd@h3(!}5$wMW^@rqZ@Z?#io8ELAADlO30T9XlaO3mO-uiU$5zU3voO^IRfa#
z%&?S}pKix_h63+U>g#-o_5(&et;d_G>c^gll$wys;A6@#_Bar6v}iVF0yt>N$|ba{
z(?<H{!#k5|;k~&K=|P`#fTH+7b=m>{D8+4Mrjn4_y)Q|1(7;6st;2ktNpEZE9og$E
zXSRKI#9cZIvBM0~neZ#FVJ=(IWp1vruL?7(w|-v^>{=QIx9&CGThAMDI0i13H5MLP
zrg@NY;_azEI}2;)4l{D?FY*O{oURqR0>7gW=LFJ)MlHd7w|2RaR{GWTB6HY!!&y*R
zb4_11joF~;gM8XZn`^0h44a{rJLbmo*!z}N^ZQUu_smqP<;f;GkQd{()WBkuWZ<#w
z)s>j_lvt$UxpJeJ32E&~(2{3n3~y#a;q%C?20|jvm5cJzp{I`v=S2n)qL(==b$WMK
z3yOxjBi^z%GgNI+YsF98ZQYhrC^(sQo5)ga`9XR3zJox9OZdKKoSt+j%E3Tu{cz+m
z2FE#!c<8~}pHP6TQgnx(^K)+kpYV;4;EG)8rQCv52f3UIb-I1Tk|K3oC__GfPis<B
zk5O-DjbQ0Qqqr*8;*7Gl<L?g%S;eVnQy4gr)1>P^Njro|BU^1u_tiD#gNa2FiTfdb
z(Vi1b$T49-=YJZ6;=Xyygu9zryyz;modf%3&5@t%UdY<e{cFQsN(zbGJ76g<PHhAI
zhuW<0=f08dFAD<|Nc}-+E8VQ?{ukl&pnW0oxH8`~k*3SiPw=1Imu!)kZ$cYX3<!r3
zaR@q*SyN+z?iFilrlvTisyR5`h#|MLt70&wtQA;USe3B;d;>E^_<Yg}?|hY*H<h=?
z32;%BbyN*6Ek)5m;<T{j!7ZzAZSKo@S5|BpV2~g&YZ4#&U0Te>Nh!Pi1M8bea-_nb
zc*_{}H*!IyhGQdFhAEll>Gy#SVz`*DEm=RF^l&jnNtZJZjq%P5`UU_3n&tX<HSV9D
z1GkehHimYO3*5EYsPE8kg=)WLxaG*C)E)QB*M#N!Eb}bj3zW3pNc>unB~Rp6#nF0G
zbFJ^P?&%(zbZym&k9*^G#uis+$a9lnGD1L^MG|G`nRnlrY?5>AUbrK8yT!)@d@$)Q
zq4z&VaH}iyQSa_*%B26m`0@54d15=04MoRmv)u4!yic=7<nErW;}(&*$~TgrVO@vo
zD0$uKjHMW5lhJqsU<sd(g+Zd=)@pbVJaxyCDK)ZBj>}=LY(?}&w0vKEal?m^*s|_j
z#739lYAvy{*2)cEBL55694W8H>CbbI)5kSd_w7AP5k9wvr;eAIdDi)g*KKxNzP*^_
zW>o3Rc{-gACn5Y}-3zaAESUrR8BEx{zP1~_gT}=Tr64p9$x3PW!Xi<AIAhQaD|>iK
z>8VQ7NEDh#;f(hd8c`Ar2RuNDtxkD~W!NW+NO4h+dW}RA#4fKD)NyFgQgiS%&yN)m
z8cr)sZxygg;=i?UR(4a$re$H^kxz<GH<KnZQW`Os^b!(Nlj`ab8qm2=A*}G4U_HGp
zR|oEOMYnm4DM`}P+{nP-xj8;<H3N8RfWX0BkCv8PA2+e%k<LST<hv~%XLilyg)udb
z>7}Wn;1pj}e^~$Xq3j{Pff(L_7*;|${JhJubfcTlpwl3~rD|V&&N;5Ghud=yXF$%T
z=DjT&)EG}NTSTxq@<z~hQqEGnz3wn>6Gi{~$}3khlGMx=pTpRo$wq5+pdqy3g3HOd
zzCHCLfVK1Z<4o(WwABe)G{c)p-b;Iz#_h=L6nJMNg7Zd2km2%U*AF4oNRtKG3>{b7
z<&HR_V*hB<KH^13ubF)J{MNe-wIQ80CNUh~@zAX6)meYjvst4BC@t;TQbG7ARV2J4
zFSC4+)Wc);#&4zTWcqQ@^XiJJE`rgC@2t#4;PN0h3%2{(yQ+WggJL~syvz66>(0+Z
zZ*^^xTJAcSpXKefPIqBM?RZwOWFG(huL$4#Gy|_DvWJ%72hcnQpX0+)gtfkypgSGI
zLp8g{FYoYv6UF!63T5R#rfaJ<ST|f1vYB1hPns+b@LldOawl~U+MQ`P=V!Dr*!8)s
zc5T`6AMk2EXewZG|7gzt6+_aW&(0x2IWyn5$J<mom_^7|S6W+`TLv^*Zh+O~Uc*3^
zfia;IxQ=c4Wt#dhIK25h4u4~5r#{+|x@{=rIT#(W>~tKb*=Hq0aKE(bohTD6#Cu#D
zl#aVB)3n`CTCwc2zjH@(x07mZLK2_hTH;BcbrB^Ho@*YwUmHDodEc4X@$=!-@hv3@
zG0)vx-;C~&z=fCRs^hTq^8I<(x?}dSyy0~s=XrSaq6|SEad^t-kM7$et38RWri0Cm
zS3HZcwOmfaQ3C>=v|P`VJA1MIkgh$=20A=7n^uF2k*vF&`18d2LXJHvQDQwVw!A$8
zppWL}UA~&A+%->AF28UyRuGAdeyw-bwy@?tqyediOAzq5o^QsQO|qJ<GC!`Z70q^v
zkJDcXaaBKvT>jAJF^3iJ;>>NGU7ld^+zgO1)11dG;WOiIHW>AModF%5&KVH)=yiN0
z9R$lnF-`Q5OCb2}nj_@H?GLSwDo7;a2`6!85oDigkyb6a`jN=Ihg*Apv>#GaFI4mc
zKxI5_01v?7XXWcM2BFibpFZW!%Ncenbt^S1C9SG70Ilp@A?J=q(Pd!JQ1H&T1g~um
zv2B5%Ar9}K_(S--e8@Q-!Nw^x>r5!>YRTp0R+V*oRpDWm>QPqn3wO1vH9%w-M?=S{
z7_78{2w%g93&aVSOuZ^_y<u0P%^z2^2v4xxrWNF{d|k%6Wp2)BbMmQ{DPQ4D<<4b6
zE}}=+Qs{mAaTaycQB&#$eyZK_-FHWlL!M^yMc*o!=*+!?TiJK+n-&h^Y}<3VWtktN
zyswWl+gvS-OBQN3Yb^I(C24@l)6-SS1=3Q`n~sW%EH8Z7&ucN;hl_&JJug-pC++v2
z7HU`Hg3l}4=zJVNAz5XM-fB5E7L_fIIt~YqII&7~HcJJ+@@sP=`I4=yW4x3Wo(FrP
z<_+f0>nQm|hX&j~Jf3#@Q#Wbg$SpNiJpCZSf`;_lCl)$Q(gX>`E<bc3Dz;3-nnyp`
z&Yv>OCwf;1I2}M<;krzfVm;Hk&Xzv14j+dr6X{+s6cg8i2GTr@f0BgURo=H>k*pz{
ze~J8TURN_rFQn3Za+Hfo#OGn9W_>2an!z~BLkYTCqVAX`X_0j~drD0SEpAiP_t;=^
zOcJd3daf>%HJm>e8A+W)MY?}z2oGLgcK0z`bk)sq+o}-ZC=I5T^H>#Ap7pLXxOM6a
zDBljJVpx1O__2K47_;e0VX>s`JnP2|?4t)cmD_r~-O9<OK9@_dt|e}sXWviMI%gvw
zgk2vpFJvF`?W9{$)aNnV94Uywtc~!rrqA<o=RbZLB-#r9{N-Fq$Stpa`BQc>`aVfW
zDQ93$z66t2#@SSt(9qoNU_tX5?oc`(_6Guvi!K3pP_6<2aER4bJ>b0|y{FyqSNyoy
zU^6EEH;+TVG>=<kE2SO#XNcBjN!ps8t3B3_w~p9cB&P5h-yWWvf*|T1Bct~XA12z4
zaJ#mK@^>rN9ZiLX@Z261v66p97ebhPU%eZX_J8ULYG#SjG+0W0Znj8RB?;C<;d`2U
z{5W0LQ%2}udtj!0y=m7&z!EKF+1ps={*~odOg&FF`N8&c;p*xuqDP<I(AL$*PFEI+
z=PF$*)RH;xXZD}tpRaDNoT<4c1hDbgZEMZ@5*mAmdD+fJ3?DBITdKcaN%yTYls5>C
z5+&pfhT0L$R@z_jcKZS2JfqYIrhRHoy)T!oJi}C`wS?xAIAn0IRt}}gu?KD_ocl>Q
zDY{Sw9<~nG2TJ<SezveN@<hQ3HJ`PZ)Frw;0;^ANb`cxOk7;$zK4k3A81ig}<09*V
zgaiRyzTc&mj@+s~SY2(L_5I59wm;f5>Wk4#k1LPou}$bF#=}i=vlm-x#A&0tvhAP6
zn7$ZuuM?U8KHXgsLBcQ%^ggJ*zLl%?+M27A+8i{~m6~~~xH(D94?2-4j-4_CMw_^%
zr<_#+_F<!SO!)6HqLB49Z|pQ@mXY<1aPK1e?ISAa4<LIzpQ+pAI+s3`JihCEd`Pmy
zRi#7OSsYNhv7hUXfSymyB86<8oxUW}_!!mjt6Zt`mMnT{`EFzt)*7XC(WgtTrZ2%>
zw63V&;j)0+_PlUd^81>0K4&xc<QNnGC`3kzMYiV1NqkqAB}}V7pmk~C_Gs$avS*+(
z%jTL}kgYdXrofb>Qhe1NDU_mrh5)NF-X`)O7Wk$kf|9}-p3FMY^p^&eCxv#$XHjXH
zSQF-WhU1Yug=6<;?(G)dW6v)iGxl4Lw|#u3TllZ9pS)Xd6d;zL^3(Crg>NurNLyQ$
zh0#2S<L7&!?I(ujps`*<2|90bey?%rswYFbxI{0y<8_dh0mLWMVNfyzslh0JCH=lX
z&a!cbGxlQ$o;>f^cGn3eE1GBD(mYaz(ndtNa)bxrqtNruWu?<}MwdCQ%FZ<BebI-W
z_=#;r?SNsn9OKQW-4L!ZE*ix5ew7e#?;*!BcM0Ne^&aOBM@jN(pcjM3qj%EQuZS0+
zS!c^FBIxbB@tg!>19AgXJ#=Ow<s{4!xDEwBoY|D*&a)V3=Q3t!zP`(@Lo-Y<7YW)o
zDHfnt&fT+Pd23<>aVdX&(mjh1Ecf$pn8l9qElG*k*W%nFk*I}ZA~wr~g(!tob$ful
zoQCcflxu72=6x%^L?4S|!rK*y{Sk-0;B?OWVw_(<_N7jW;_RTwGx6>Xfuue1-8`x_
z1P}`Nzcg9v$icUMYrG6Gd3}DQqbyYVWLX+S72==NSQ4u|oiMV6aZHN83|ID5(Bipx
zuq%$JHWhy{!Cln?Z#yBFWt4BzG&VQlbP%a1&X=)|5}uAXy41y6#+rwgzN3~b6j=cY
zdu*1FPHbR2K31?#w1|1c{y`A8CXo*vMsl#o?Y_XC^DR)`KOO0LTra-zWBlTMR7m@?
z2IC!H#m8@lnOX!+LSiSfofB8H!XkjWmYPM(S6{itruz)=#CFacZCMzzwQG+%E?iFc
za><>kjFCnmT{7wu!b?9uBsu!;(zQF987~Wqe3Oa);0Bj+-m1l*qJ+*z7DhnRMXyXt
zvGLhXhthza^YP1sQU7{bw*?tV;Owl5qOXfMun`gT=F1JUbHf9tOF*!iZ6IUkK1+@V
zRpc(66c?WwPg$G#Y80x;GSoDX(iwHmDvy(`BBu5u+%-vUl*PMT<qfHFgY0cPfkrjV
zSr}KA^0KQwxKcb#Ig|!JWM|aEt+LRV6ALDrl@IY@NrP&EdU(=plR2a)kz|;8SzN`g
zQ^u8s6^UyU*&MWRNAJ;v;+WtRqH*=5>}Cuh+G+2C7pNH?q1$QI3v2e661Rj@iu7!6
z1ems%dAgbaQ^k(qJ}&>Gy)%t!>e}KsgGdEMWpn~!u&B_Go0~a=2!upI0y0!+5oJh#
zKuAIoW}yxUVo@w8QUOJ)pr|MyAR>b^Q*n9-MS<47Qd$QD6p=ySNf^qIzW3}}ukVZZ
z1MB90_ZjxSCx>&g?*83F`j6+8^s_ORpIEI=rIoZsf4_7o6ZO=>RGZhoY-Mn>Ue4^u
zgCugku=GI@bHH86_@=@hZYy%dUCUhsdNKZMJQI8ST83Bhw|%o<IbG-7!1GK><vC`x
z_5Bv>;9Kq%?(qKGZM~9<<o4`KM*TwjwvnZNS!rh*%QHy2J4O=eY4w4j*B&e7e$gm;
zxl1STs9IBz3BjZ1iN!j&x8}T>3)9r#H@02t31O?CF(=JL;}`SS?$I|RaRnzy{<Bxs
zDWnWa2#iAscWtY#igfm_yjYuTn{855tDKt$9}E3t(4F_Fx1u#+RZ*&WN;dBDa2ML{
z_2ELK(R<zMuS{6)RbO^1P($^rn{(dk`3PH^m#_WNh;_Xu;bp$7YAW{rz$QCm{>8@a
zP5L;aGDE$+nJwE>2ALTN{dBSK3SQIBOzo?O)ZZBE&rRy;U$#8kJ?+Ks38g70_iI!S
z9i4;u^D@0WEDD4vEXw8|(@Ta9^gisowxr6qYVo&yISH5iG#j}L!(G}h{CzS~NeQ>9
z^(b+~>+G0H71fY?vo|OW_v)v*ei8DGG4f5F+o>&?WoD;8z2f7(s;6KpPRaHn?D&l6
zyzD67@j{~7mg3Uh==M{^<Szqk`t{4x&V&{ckGjyEnU{x;cf2JHt$H>uH($?I{c-)!
z(apw04(5i6|HhL-?G2`?k5~6q-KsKlGA2d+-WDy|d%idkq2;jYVGXtoFK}7p(zVa7
zp4YiH(XsT@%0VKHUmr^irEPolWSi;8{%@nHYqB_7zA;E%-}Fko=I)|(8H-Kd7<{)c
zrf>P$pF4-H7FDKcm~Ac_So_1Pw}m&tS;<E<?e3I>q;}7;iX1*fqBG{P1%};0@k@<=
zG`pmq9j%Y<@4pW@XENCN8?RZWcgKh;9Xei^-z*ymDJ?qqz%cBB>9K^JdNx|v^x$p$
z<K-v%_ZPp}WSu_iSLI6U)WRK#2ZlelXl}ol&%AypY$r1`Yp3ONyQe{~G_TyU52t>c
z5K{$y#PMCyvpOR0h@?Zi0&;UqJdd02$?2$k$M37Ldb5C)hEqDLj;Pi+iyaWPc4(R2
z565iCSzDgycSqM`k!n*|O-f{ieO`RaDG4^cXoJ3<Rv+{2mnJlY>LLHZcTdcNt}i}$
zY<qP80)4(NOK~6^j^S8su+wZ23>GU6KURovn$>9<;Y_!hvxkD&s&OHwbM67vxh3Zo
zGM&6yU&G=bay5GNY=iXsg9nzC_+@UzLl4*KrqwCjJr~1dWW=u<a*m&!`wn88Pz{u#
z$;5(aZeXkx>dv8>iW|xmgL&8c_)oG_94e}lzq>LgCmh}J9{Mt-$n6a0i%X5!sqf1q
zMOk}_gDvjA97uPVOSkKIKEFmGWfhmUJMin>6`EN+zb(1?U|$rz|FYA3_wWFFk*?&z
z-0R_l1G)^?l+w2L*vcNCwS#`T_X-u#kC}Jsugl)yvM42X<ov#oV)McBPs;DPAuWp)
z_U*l;Ic)ybPg|}Sc`%Vao$MWZHs5vdILJ?K$kw-8c|YdPP)nL#dVrH#n)1NSd5T_|
zh<B)MhRQF`D{R%lAMf_{7?RW!T%ghyvo`X)Lyl@;lOB0=!F=_j&%LkF7b+OOUnA6x
ztrQ-pO$bjbyZ77Pm`x1TT}e;cErpKXXQe--_A2Q}%6OV>`mvXOeQ1v+MBdu7JM|#q
zw8SHBUmlC#RN!#V{5jjv>h`R?Dkmz8_BSsXX{h5pQY^K+<@r|Jb@*X(z4C~?8cN+^
z(=X`G<WCWzIDyBeTEmF%P8?G=Xg{~3dh@eL`!k}ByxO<5UbzFL_@4a8%zxyyAE#G~
z)P_!ORejihWn*FTvW$lPKc5{oSY4Wb)A`6*G2X=UQJS@?faCb<>4k+#s3SHE&o@N#
z)cD`a9HI^E8YuN)7_T^Q%euG_#pnhfgVUcK7j|ZQx2W`9ad0B}S8$SQkWrt936l=5
zcyMF@H?Y0rnahiSrwr|{)evD@<8GJYv<qq<rF0!!^eoB#G(E2R#=F(XqSx+o{z)X^
zC@17U!977k1L#2y8K%t>0YHBMLFj>ii8xQhWI~(_qa}N8e(a*GPMIKMJB~k6FT+cX
zV;?8@QtmAKar_fVDVg$UJ#|e4fJ+5&BnTgXapPMcyUVMP2rk<K>4s-PEFql}z+D$5
z;<!XPxcWu~`I6blH8g4jB_dcD4Cs=Gh+rOHOo^~SdQ0JN6mTw;(MW{ML=t3y#F}AH
zL<obVsZm92KZ>&rbF2{fWPuEjNQ4wLIy^kwEF5bl5c#7qWHK2I!Dtvp0SlBkk}vU&
zK=H*!<28&!$Uv$LLRzD@k04ZHfkYz4>J?6^moGMxb<E6H5R3*F&=@l;T3Qh}r;O*x
z&{$kwkw7f)lU&P3xCumTkmZ6QP^I>N*ig~ZwkEYb=FcQWZg1GW6HW?4MLd~{Y+p2I
z6p$wd9m2>u#P+55j%E$fWN~uggp8i>xHOPdG}=5kA3c#>MNcmC7rO`U<3#_a1S<k?
z1TkiitZ%@GGM3WhDiHAgEMC*is1pK5nz2NaW;CH7JPLz#g<uMnNRg#AQ6Pwlo@Oa4
z2@;*Sev$u8$w`)f^)`VHuvq^-62Zaa!C<i{HUi&JDdEu8h87yiWmD*o4VFw|fFERS
zAZrv3#*<N2Oa>jru*So90?vj2K~^$1r<RpE3KUzuSmF(Utbe7pNoD0YkN6u7wZEYa
z#K%THD9Rth^)Xx@6oC&i{y4fmhU<eO@Il5ON7sjiYxLhfSXhI_;l#?E_Q%Q|fT}H!
z;b7e^cOxQ0z>n`AY`9_}&pQ&VZd|z%09hUd$xqsB%z*d0J9GTdF5D;%0*6JrfsG7c
zrAyK2qkwuDR9Xg|mL<zOqit<Gs0<95WP_zckTux`PsYL0h0^48674@*NXg58N=wIJ
z$y1YD@r~;>6rC3A`ss38=};7bwZg~R+D9wRi|uoR`PmJPxo4{hylR7nq>G~1zztgh
zg${KMx!fJyt<UOJ43HVShi3^E`U|xf+j3Vm3m2@uy1t=%b61ng(&`0)i>y=@4=ed5
zqx0XJTE;E2Ta~RchjKUGKys|Rss5Czn@7PJFXiYEYDSC#{_uj0a&JHc;PKB>g8*zA
z{2e<0*`I*NWAO;-m2nMV!leg-KcQg=04qLC1B~4n8XgPo+cY~88GxpzY8Yr{Sqy{+
z2<K^bFa+|Cr)#8{_2FST8WCU<rj;eYU^hHXBa&xmFeKdvPqiaqa5L(IAPiAX{77;%
z@=Ohe<Y*W<8Z1Y{%F%FgG`t*5&OL|a_yNoD1H^B}c)`l?11rZ505qRjR*oN7Ievf<
zI<u@CKftJ+W=A3u0A*t8y(9xD`!o#({QBu*9B6nscEsu91;)YBS!YTcKqE{VLlTiU
zfVYceuizM+#Bl%fnQL@z@)k)(zxXf?><z&?K|W<TGQq1I#wG)x{6G4J1}_H*L&&;>
Zmd@+|`T;(HkWKG2o`99U$VA%de*vTI=;8nX

literal 0
HcmV?d00001


From d6dce956825b8fe96643ca4f56af6ce9e79d4182 Mon Sep 17 00:00:00 2001
From: imClumsyPanda <littlepanda0716@gmail.com>
Date: Fri, 1 Sep 2023 14:15:13 +0800
Subject: [PATCH 5/5] bug fix

---
 server/knowledge_base/utils.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/server/knowledge_base/utils.py b/server/knowledge_base/utils.py
index 8582c9c..a8a9bcc 100644
--- a/server/knowledge_base/utils.py
+++ b/server/knowledge_base/utils.py
@@ -197,7 +197,7 @@ class KnowledgeFile:
 
         print(f"{self.document_loader_name} used for {self.filepath}")
         try:
-            if self.document_loader_name in []:
+            if self.document_loader_name in ["RapidOCRPDFLoader", "RapidOCRLoader"]:
                 document_loaders_module = importlib.import_module('document_loaders')
             else:
                 document_loaders_module = importlib.import_module('langchain.document_loaders')