diff --git a/README.md b/README.md
index 8f9827a51385e541e551ce75f14d83c56659015c..9ef33c06a1ec1cf7a825cea26683f59aba08334e 100644
--- a/README.md
+++ b/README.md
@@ -1,6 +1,6 @@
 <div align="center">
 <a href="https://demo.ragflow.io/">
-<img src="web/src/assets/logo-with-text.png" width="350" alt="ragflow logo">
+<img src="web/src/assets/logo-with-text.png" width="520" alt="ragflow logo">
 </a>
 </div>
 
@@ -124,12 +124,12 @@
 
     * Running on all addresses (0.0.0.0)
     * Running on http://127.0.0.1:9380
-    * Running on http://172.22.0.5:9380
+    * Running on http://x.x.x.x:9380
     INFO:werkzeug:Press CTRL+C to quit
    ```
 
-5. In your web browser, enter the IP address of your server as prompted and log in to RAGFlow.
-   > In the given scenario, you only need to enter `http://IP_of_RAGFlow ` (sans port number) as the default HTTP serving port `80` can be omitted when using the default configurations.
+5. In your web browser, enter the IP address of your server and log in to RAGFlow.
+   > In the given scenario, you only need to enter `http://IP_OF_YOUR_MACHINE` (sans port number) as the default HTTP serving port `80` can be omitted when using the default configurations.
 6. In [service_conf.yaml](./docker/service_conf.yaml), select the desired LLM factory in `user_default_llm` and update the `API_KEY` field with the corresponding API key.
 
    > See [./docs/llm_api_key_setup.md](./docs/llm_api_key_setup.md) for more information.
@@ -168,6 +168,11 @@ $ cd ragflow/docker
 $ docker compose up -d
 ```
 
+## đź†• Latest Features
+
+- Support [Ollam](./docs/ollama.md) for local LLM deployment.
+- Support Chinese UI.
+
 ## đź“ś Roadmap
 
 See the [RAGFlow Roadmap 2024](https://github.com/infiniflow/ragflow/issues/162)
diff --git a/README_ja.md b/README_ja.md
index e6e2ed35a28bc942fcd1f203343835f0bec6c806..8437bebfb7719985b5d430f501b290e525a481f1 100644
--- a/README_ja.md
+++ b/README_ja.md
@@ -124,12 +124,12 @@
 
     * Running on all addresses (0.0.0.0)
     * Running on http://127.0.0.1:9380
-    * Running on http://172.22.0.5:9380
+    * Running on http://x.x.x.x:9380
     INFO:werkzeug:Press CTRL+C to quit
    ```
 
 5. ă‚¦ă‚§ă–ă–ă©ă‚¦ă‚¶ă§ă€ă—ăăłă—ăă«ĺľ“ăŁă¦ă‚µăĽăăĽă® IP ă‚˘ă‰ă¬ă‚ąă‚’ĺ…ĄĺŠ›ă—ă€RAGFlow ă«ăă‚°ă‚¤ăłă—ăľă™ă€‚
-   > ă‡ă•ă‚©ă«ăă®č¨ĺ®šă‚’ä˝żç”¨ă™ă‚‹ĺ ´ĺă€ă‡ă•ă‚©ă«ăă® HTTP ă‚µăĽă“ăłă‚°ăťăĽă `80` ăŻçśç•Ąă§ăŤă‚‹ă®ă§ă€ä¸Žăă‚‰ă‚Śăźă‚·ăŠăŞă‚Şă§ăŻă€`http://172.22.0.5`ďĽăťăĽăç•ŞĺŹ·ăŻçśç•ĄďĽ‰ă ă‘ă‚’ĺ…ĄĺŠ›ă™ă‚Śă°ă‚ă„ă€‚
+   > ă‡ă•ă‚©ă«ăă®č¨ĺ®šă‚’ä˝żç”¨ă™ă‚‹ĺ ´ĺă€ă‡ă•ă‚©ă«ăă® HTTP ă‚µăĽă“ăłă‚°ăťăĽă `80` ăŻçśç•Ąă§ăŤă‚‹ă®ă§ă€ä¸Žăă‚‰ă‚Śăźă‚·ăŠăŞă‚Şă§ăŻă€`http://IP_OF_YOUR_MACHINE`ďĽăťăĽăç•ŞĺŹ·ăŻçśç•ĄďĽ‰ă ă‘ă‚’ĺ…ĄĺŠ›ă™ă‚Śă°ă‚ă„ă€‚
 6. [service_conf.yaml](./docker/service_conf.yaml) ă§ă€`user_default_llm` ă§ĺ¸Śćś›ă® LLM ă•ă‚ˇă‚ŻăăŞă‚’é¸ćŠžă—ă€`API_KEY` ă•ă‚ŁăĽă«ă‰ă‚’ĺŻľĺżśă™ă‚‹ API ă‚ăĽă§ć›´ć–°ă™ă‚‹ă€‚
 
    > č©łă—ăŹăŻ [./docs/llm_api_key_setup.md](./docs/llm_api_key_setup.md) ă‚’ĺŹ‚ç…§ă—ă¦ăŹă ă•ă„ă€‚
@@ -168,6 +168,11 @@ $ cd ragflow/docker
 $ docker compose up -d
 ```
 
+## đź†• ćś€ć–°ă®ć–°ć©źč˝
+
+- [Ollam](./docs/ollama.md) ă‚’ä˝żç”¨ă—ăźĺ¤§č¦Źć¨ˇă˘ă‡ă«ă®ăăĽă‚«ă©ă‚¤ă‚şă•ă‚Śăźă‡ă—ăă‚¤ăˇăłăă‚’ă‚µăťăĽăă—ăľă™ă€‚
+- ä¸ĺ›˝čŞžă‚¤ăłă‚żăĽă•ă‚§ăĽă‚ąă‚’ă‚µăťăĽăă—ăľă™ă€‚
+
 ## đź“ś ăăĽă‰ăžăă—
 
 [RAGFlow ăăĽă‰ăžăă— 2024](https://github.com/infiniflow/ragflow/issues/162) ă‚’ĺŹ‚ç…§
diff --git a/README_zh.md b/README_zh.md
index d7452bd0ee8f4ae4a5f67c2fdde57d31fb9dc705..eec642e8adeced8c5de6814eff192e3a65e981cd 100644
--- a/README_zh.md
+++ b/README_zh.md
@@ -124,12 +124,12 @@
 
     * Running on all addresses (0.0.0.0)
     * Running on http://127.0.0.1:9380
-    * Running on http://172.22.0.5:9380
+    * Running on http://x.x.x.x:9380
     INFO:werkzeug:Press CTRL+C to quit
    ```
 
-5. ć ąćŤ®ĺšć‰Ťçš„ç•Śéť˘ćŹç¤şĺś¨ä˝ çš„ćµŹč§ĺ™¨ä¸čľ“ĺ…Ąä˝ çš„ćśŤĺŠˇĺ™¨ĺŻąĺş”çš„ IP ĺś°ĺť€ĺą¶ç™»ĺ˝• RAGFlowă€‚
-   > ä¸Šéť˘čż™ä¸Şäľ‹ĺä¸ďĽŚć‚¨ĺŹŞéś€čľ“ĺ…Ą http://172.22.0.5 ĺŤłĺŹŻďĽšćśŞć”ąĺŠ¨čż‡é…Ťç˝®ĺ™ć— éś€čľ“ĺ…Ąç«ŻĺŹŁďĽé»č®¤çš„ HTTP ćśŤĺŠˇç«ŻĺŹŁ 80ďĽ‰ă€‚
+5. ĺś¨ä˝ çš„ćµŹč§ĺ™¨ä¸čľ“ĺ…Ąä˝ çš„ćśŤĺŠˇĺ™¨ĺŻąĺş”çš„ IP ĺś°ĺť€ĺą¶ç™»ĺ˝• RAGFlowă€‚
+   > ä¸Šéť˘čż™ä¸Şäľ‹ĺä¸ďĽŚć‚¨ĺŹŞéś€čľ“ĺ…Ą http://IP_OF_YOUR_MACHINE ĺŤłĺŹŻďĽšćśŞć”ąĺŠ¨čż‡é…Ťç˝®ĺ™ć— éś€čľ“ĺ…Ąç«ŻĺŹŁďĽé»č®¤çš„ HTTP ćśŤĺŠˇç«ŻĺŹŁ 80ďĽ‰ă€‚
 6. ĺś¨ [service_conf.yaml](./docker/service_conf.yaml) ć–‡ä»¶çš„ `user_default_llm` ć Źé…Ťç˝® LLM factoryďĽŚĺą¶ĺś¨ `API_KEY` ć Źĺˇ«ĺ†™ĺ’Śä˝ é€‰ć‹©çš„ĺ¤§ć¨ˇĺž‹ç›¸ĺŻąĺş”çš„ API keyă€‚
 
    > čŻ¦č§ [./docs/llm_api_key_setup.md](./docs/llm_api_key_setup.md)ă€‚
@@ -168,9 +168,14 @@ $ cd ragflow/docker
 $ docker compose up -d
 ```
 
+## đź†• ćś€čż‘ć–°ç‰ąć€§
+
+- ć”ŻćŚç”¨ [Ollam](./docs/ollama.md) ĺŻąĺ¤§ć¨ˇĺž‹čż›čˇŚćś¬ĺś°ĺŚ–é¨ç˝˛ă€‚
+- ć”ŻćŚä¸ć–‡ç•Śéť˘ă€‚
+
 ## đź“ś č·Żçşżĺ›ľ
 
-čŻ¦č§ [RAGFlow Roadmap 2024](https://github.com/infiniflow/ragflow/issues/162)ă€‚
+čŻ¦č§ [RAGFlow Roadmap 2024](https://github.com/infiniflow/ragflow/issues/162) ă€‚
 
 ## đźŹ„ ĺĽ€ćşç¤ľĺŚş
 
@@ -179,7 +184,7 @@ $ docker compose up -d
 
 ## đź™Ś č´ˇçŚ®ćŚ‡ĺŤ—
 
-RAGFlow ĺŹŞćś‰é€ščż‡ĺĽ€ćşĺŤŹä˝ść‰Ťč˝č“¬ĺ‹ĺŹ‘ĺ±•ă€‚ç§‰ćŚčż™ä¸€ç˛ľçĄž,ć‘ä»¬ć¬˘čżŽćťĄč‡Şç¤ľĺŚşçš„ĺ„ç§Ťč´ˇçŚ®ă€‚ĺ¦‚ćžść‚¨ćś‰ć„ŹĺŹ‚ä¸Žĺ…¶ä¸,čŻ·ćźĄé…ć‘ä»¬çš„[č´ˇçŚ®č€…ćŚ‡ĺŤ—](https://github.com/infiniflow/ragflow/blob/main/docs/CONTRIBUTING.md)ă€‚
+RAGFlow ĺŹŞćś‰é€ščż‡ĺĽ€ćşĺŤŹä˝ść‰Ťč˝č“¬ĺ‹ĺŹ‘ĺ±•ă€‚ç§‰ćŚčż™ä¸€ç˛ľçĄž,ć‘ä»¬ć¬˘čżŽćťĄč‡Şç¤ľĺŚşçš„ĺ„ç§Ťč´ˇçŚ®ă€‚ĺ¦‚ćžść‚¨ćś‰ć„ŹĺŹ‚ä¸Žĺ…¶ä¸,čŻ·ćźĄé…ć‘ä»¬çš„[č´ˇçŚ®č€…ćŚ‡ĺŤ—](https://github.com/infiniflow/ragflow/blob/main/docs/CONTRIBUTING.md) ă€‚
 
 ## đź‘Ą ĺŠ ĺ…Ąç¤ľĺŚş
 
diff --git a/api/apps/conversation_app.py b/api/apps/conversation_app.py
index 49374b09168f4673a65705017f12ba2d09361130..42339e1f00dae05b0202b15b976b17e8ef42885e 100644
--- a/api/apps/conversation_app.py
+++ b/api/apps/conversation_app.py
@@ -126,7 +126,7 @@ def message_fit_in(msg, max_length=4000):
     if c < max_length:
         return c, msg
 
-    msg_ = [m for m in msg[:-1] if m.role == "system"]
+    msg_ = [m for m in msg[:-1] if m["role"] == "system"]
     msg_.append(msg[-1])
     msg = msg_
     c = count()
diff --git a/api/apps/document_app.py b/api/apps/document_app.py
index 6b6715a8ba206ff3bee1ac02c49564fe77dfd678..29e168608366293ccf9b04803c053e8f8d5b18d0 100644
--- a/api/apps/document_app.py
+++ b/api/apps/document_app.py
@@ -81,7 +81,7 @@ def upload():
             "parser_id": kb.parser_id,
             "parser_config": kb.parser_config,
             "created_by": current_user.id,
-            "type": filename_type(filename),
+            "type": filetype,
             "name": filename,
             "location": location,
             "size": len(blob),
diff --git a/api/apps/llm_app.py b/api/apps/llm_app.py
index a0eb80af8fe24b50b53bc1b7d3efb020d4ba970c..78ff7bf7859e0e83af312d369c71c28dc551c228 100644
--- a/api/apps/llm_app.py
+++ b/api/apps/llm_app.py
@@ -91,6 +91,57 @@ def set_api_key():
     return get_json_result(data=True)
 
 
+@manager.route('/add_llm', methods=['POST'])
+@login_required
+@validate_request("llm_factory", "llm_name", "model_type")
+def add_llm():
+    req = request.json
+    llm = {
+        "tenant_id": current_user.id,
+        "llm_factory": req["llm_factory"],
+        "model_type": req["model_type"],
+        "llm_name": req["llm_name"],
+        "api_base": req.get("api_base", ""),
+        "api_key": "xxxxxxxxxxxxxxx"
+    }
+
+    factory = req["llm_factory"]
+    msg = ""
+    if llm["model_type"] == LLMType.EMBEDDING.value:
+        mdl = EmbeddingModel[factory](
+            key=None, model_name=llm["llm_name"], base_url=llm["api_base"])
+        try:
+            arr, tc = mdl.encode(["Test if the api key is available"])
+            if len(arr[0]) == 0 or tc == 0:
+                raise Exception("Fail")
+        except Exception as e:
+            msg += f"\nFail to access embedding model({llm['llm_name']})." + str(e)
+    elif llm["model_type"] == LLMType.CHAT.value:
+        mdl = ChatModel[factory](
+            key=None, model_name=llm["llm_name"], base_url=llm["api_base"])
+        try:
+            m, tc = mdl.chat(None, [{"role": "user", "content": "Hello! How are you doing!"}], {
+                             "temperature": 0.9})
+            if not tc:
+                raise Exception(m)
+        except Exception as e:
+            msg += f"\nFail to access model({llm['llm_name']})." + str(
+                e)
+    else:
+        # TODO: check other type of models
+        pass
+
+    if msg:
+        return get_data_error_result(retmsg=msg)
+
+
+    if not TenantLLMService.filter_update(
+            [TenantLLM.tenant_id == current_user.id, TenantLLM.llm_factory == factory, TenantLLM.llm_name == llm["llm_name"]], llm):
+        TenantLLMService.save(**llm)
+
+    return get_json_result(data=True)
+
+
 @manager.route('/my_llms', methods=['GET'])
 @login_required
 def my_llms():
@@ -125,6 +176,12 @@ def list():
         for m in llms:
             m["available"] = m["fid"] in facts or m["llm_name"].lower() == "flag-embedding"
 
+        llm_set = set([m["llm_name"] for m in llms])
+        for o in objs:
+            if not o.api_key:continue
+            if o.llm_name in llm_set:continue
+            llms.append({"llm_name": o.llm_name, "model_type": o.model_type, "fid": o.llm_factory, "available": True})
+
         res = {}
         for m in llms:
             if model_type and m["model_type"] != model_type:
diff --git a/api/apps/user_app.py b/api/apps/user_app.py
index 31fc6855207d25aac6ca5b417ef052b4a13e9214..47ed1c95693562533104eda157b3455a7db8b871 100644
--- a/api/apps/user_app.py
+++ b/api/apps/user_app.py
@@ -181,6 +181,10 @@ def user_info():
 
 
 def rollback_user_registration(user_id):
+    try:
+        UserService.delete_by_id(user_id)
+    except Exception as e:
+        pass
     try:
         TenantService.delete_by_id(user_id)
     except Exception as e:
diff --git a/api/db/init_data.py b/api/db/init_data.py
index 5f3432845d1c06325de9996d0958e60223aae266..4cc72a2d5ed596fa39b6667d7b7b3f30dc79904c 100644
--- a/api/db/init_data.py
+++ b/api/db/init_data.py
@@ -18,7 +18,7 @@ import time
 import uuid
 
 from api.db import LLMType, UserTenantRole
-from api.db.db_models import init_database_tables as init_web_db
+from api.db.db_models import init_database_tables as init_web_db, LLMFactories, LLM
 from api.db.services import UserService
 from api.db.services.llm_service import LLMFactoriesService, LLMService, TenantLLMService, LLMBundle
 from api.db.services.user_service import TenantService, UserTenantService
@@ -100,16 +100,16 @@ factory_infos = [{
     "status": "1",
 },
     {
-    "name": "Local",
+    "name": "Ollama",
     "logo": "",
     "tags": "LLM,TEXT EMBEDDING,SPEECH2TEXT,MODERATION",
         "status": "1",
 }, {
-        "name": "Moonshot",
+    "name": "Moonshot",
     "logo": "",
     "tags": "LLM,TEXT EMBEDDING",
     "status": "1",
-}
+},
     # {
     #     "name": "ć–‡ĺżä¸€č¨€",
     #     "logo": "",
@@ -230,20 +230,6 @@ def init_llm_factory():
             "max_tokens": 512,
             "model_type": LLMType.EMBEDDING.value
         },
-        # ---------------------- ćś¬ĺś° ----------------------
-        {
-            "fid": factory_infos[3]["name"],
-            "llm_name": "qwen-14B-chat",
-            "tags": "LLM,CHAT,",
-            "max_tokens": 4096,
-            "model_type": LLMType.CHAT.value
-        }, {
-            "fid": factory_infos[3]["name"],
-            "llm_name": "flag-embedding",
-            "tags": "TEXT EMBEDDING,",
-            "max_tokens": 128 * 1000,
-            "model_type": LLMType.EMBEDDING.value
-        },
         # ------------------------ Moonshot -----------------------
         {
             "fid": factory_infos[4]["name"],
@@ -282,6 +268,9 @@ def init_llm_factory():
         except Exception as e:
             pass
 
+    LLMFactoriesService.filter_delete([LLMFactories.name=="Local"])
+    LLMService.filter_delete([LLM.fid=="Local"])
+
     """
     drop table llm;
     drop table llm_factories;
@@ -295,8 +284,7 @@ def init_llm_factory():
 def init_web_data():
     start_time = time.time()
 
-    if LLMFactoriesService.get_all().count() != len(factory_infos):
-        init_llm_factory()
+    init_llm_factory()
     if not UserService.get_all().count():
         init_superuser()
 
diff --git a/docker/docker-compose-CN.yml b/docker/docker-compose-CN.yml
index a4f3f77c3aff6c07f1858d85ef834df6d253e6a9..2621634208b1b46db57f88da74d2403b72a9609c 100644
--- a/docker/docker-compose-CN.yml
+++ b/docker/docker-compose-CN.yml
@@ -20,6 +20,7 @@ services:
       - 443:443
     volumes:
       - ./service_conf.yaml:/ragflow/conf/service_conf.yaml
+      - ./entrypoint.sh:/ragflow/entrypoint.sh
       - ./ragflow-logs:/ragflow/logs
       - ./nginx/ragflow.conf:/etc/nginx/conf.d/ragflow.conf
       - ./nginx/proxy.conf:/etc/nginx/proxy.conf
diff --git a/docs/ollama.md b/docs/ollama.md
new file mode 100644
index 0000000000000000000000000000000000000000..c226d86144e7a6b1653c60bd170f891afb1eb04c
--- /dev/null
+++ b/docs/ollama.md
@@ -0,0 +1,40 @@
+# Ollama
+
+<div align="center" style="margin-top:20px;margin-bottom:20px;">
+<img src="https://github.com/infiniflow/ragflow/assets/12318111/2019e7ee-1e8a-412e-9349-11bbf702e549" width="130"/>
+</div>
+
+One-click deployment of local LLMs, that is [Ollama](https://github.com/ollama/ollama).
+
+## Install
+
+- [Ollama on Linux](https://github.com/ollama/ollama/blob/main/docs/linux.md)
+- [Ollama Windows Preview](https://github.com/ollama/ollama/blob/main/docs/windows.md)
+- [Docker](https://hub.docker.com/r/ollama/ollama)
+
+## Launch Ollama
+
+Decide which LLM you want to deploy ([here's a list for supported LLM](https://ollama.com/library)), say, **mistral**:
+```bash
+$ ollama run mistral
+```
+Or,
+```bash
+$ docker exec -it ollama ollama run mistral
+```
+
+## Use Ollama in RAGFlow
+
+- Go to 'Settings > Model Providers > Models to be added > Ollama'.
+    
+<div align="center" style="margin-top:20px;margin-bottom:20px;">
+<img src="https://github.com/infiniflow/ragflow/assets/12318111/2019e7ee-1e8a-412e-9349-11bbf702e549" width="130"/>
+</div>
+
+> Base URL: Enter the base URL where the Ollama service is accessible, like, http://<your-ollama-endpoint-domain>:11434
+
+- Use Ollama Models.
+
+<div align="center" style="margin-top:20px;margin-bottom:20px;">
+<img src="https://github.com/infiniflow/ragflow/assets/12318111/2019e7ee-1e8a-412e-9349-11bbf702e549" width="130"/>
+</div>
\ No newline at end of file
diff --git a/rag/llm/__init__.py b/rag/llm/__init__.py
index 74a8dbf88b4723ea707585186e718f7c45f5d71b..c3fc7db816a441f22a32ca0813435b9414c7c98f 100644
--- a/rag/llm/__init__.py
+++ b/rag/llm/__init__.py
@@ -19,7 +19,7 @@ from .cv_model import *
 
 
 EmbeddingModel = {
-    "Local": HuEmbedding,
+    "Ollama": OllamaEmbed,
     "OpenAI": OpenAIEmbed,
     "Tongyi-Qianwen": HuEmbedding, #QWenEmbed,
     "ZHIPU-AI": ZhipuEmbed,
@@ -29,7 +29,7 @@ EmbeddingModel = {
 
 CvModel = {
     "OpenAI": GptV4,
-    "Local": LocalCV,
+    "Ollama": OllamaCV,
     "Tongyi-Qianwen": QWenCV,
     "ZHIPU-AI": Zhipu4V,
     "Moonshot": LocalCV
@@ -40,7 +40,7 @@ ChatModel = {
     "OpenAI": GptTurbo,
     "ZHIPU-AI": ZhipuChat,
     "Tongyi-Qianwen": QWenChat,
-    "Local": LocalLLM,
+    "Ollama": OllamaChat,
     "Moonshot": MoonshotChat
 }
 
diff --git a/rag/llm/chat_model.py b/rag/llm/chat_model.py
index c0379a8f0f0586ade6c3a78ab29cf7d92ab6d241..4da841bd126c4da6f5590e5fc15a78ca48a486e1 100644
--- a/rag/llm/chat_model.py
+++ b/rag/llm/chat_model.py
@@ -18,6 +18,7 @@ from dashscope import Generation
 from abc import ABC
 from openai import OpenAI
 import openai
+from ollama import Client
 from rag.nlp import is_english
 from rag.utils import num_tokens_from_string
 
@@ -129,6 +130,32 @@ class ZhipuChat(Base):
             return "**ERROR**: " + str(e), 0
 
 
+class OllamaChat(Base):
+    def __init__(self, key, model_name, **kwargs):
+        self.client = Client(host=kwargs["base_url"])
+        self.model_name = model_name
+
+    def chat(self, system, history, gen_conf):
+        if system:
+            history.insert(0, {"role": "system", "content": system})
+        try:
+            options = {"temperature": gen_conf.get("temperature", 0.1),
+                       "num_predict": gen_conf.get("max_tokens", 128),
+                       "top_k": gen_conf.get("top_p", 0.3),
+                       "presence_penalty": gen_conf.get("presence_penalty", 0.4),
+                       "frequency_penalty": gen_conf.get("frequency_penalty", 0.7),
+                       }
+            response = self.client.chat(
+                model=self.model_name,
+                messages=history,
+                options=options
+            )
+            ans = response["message"]["content"].strip()
+            return ans, response["eval_count"]
+        except Exception as e:
+            return "**ERROR**: " + str(e), 0
+
+
 class LocalLLM(Base):
     class RPCProxy:
         def __init__(self, host, port):
diff --git a/rag/llm/cv_model.py b/rag/llm/cv_model.py
index 61b942cdef72aec227d36f2fdad22889d081f5a6..d764bc873009fd1cf3910cd2acbfd2bfb309b92a 100644
--- a/rag/llm/cv_model.py
+++ b/rag/llm/cv_model.py
@@ -16,7 +16,7 @@
 from zhipuai import ZhipuAI
 import io
 from abc import ABC
-
+from ollama import Client
 from PIL import Image
 from openai import OpenAI
 import os
@@ -140,6 +140,28 @@ class Zhipu4V(Base):
         return res.choices[0].message.content.strip(), res.usage.total_tokens
 
 
+class OllamaCV(Base):
+    def __init__(self, key, model_name, lang="Chinese", **kwargs):
+        self.client = Client(host=kwargs["base_url"])
+        self.model_name = model_name
+        self.lang = lang
+
+    def describe(self, image, max_tokens=1024):
+        prompt = self.prompt("")
+        try:
+            options = {"num_predict": max_tokens}
+            response = self.client.generate(
+                model=self.model_name,
+                prompt=prompt[0]["content"][1]["text"],
+                images=[image],
+                options=options
+            )
+            ans = response["response"].strip()
+            return ans, 128
+        except Exception as e:
+            return "**ERROR**: " + str(e), 0
+
+
 class LocalCV(Base):
     def __init__(self, key, model_name="glm-4v", lang="Chinese", **kwargs):
         pass
diff --git a/rag/llm/embedding_model.py b/rag/llm/embedding_model.py
index 6ee3a58017b156c35501cd07f6e7af06c170acd9..d5b763d1855f53039340cdd1e87e7665e44005d6 100644
--- a/rag/llm/embedding_model.py
+++ b/rag/llm/embedding_model.py
@@ -16,13 +16,12 @@
 from zhipuai import ZhipuAI
 import os
 from abc import ABC
-
+from ollama import Client
 import dashscope
 from openai import OpenAI
 from FlagEmbedding import FlagModel
 import torch
 import numpy as np
-from huggingface_hub import snapshot_download
 
 from api.utils.file_utils import get_project_base_directory
 from rag.utils import num_tokens_from_string
@@ -150,3 +149,24 @@ class ZhipuEmbed(Base):
         res = self.client.embeddings.create(input=text,
                                             model=self.model_name)
         return np.array(res.data[0].embedding), res.usage.total_tokens
+
+
+class OllamaEmbed(Base):
+    def __init__(self, key, model_name, **kwargs):
+        self.client = Client(host=kwargs["base_url"])
+        self.model_name = model_name
+
+    def encode(self, texts: list, batch_size=32):
+        arr = []
+        tks_num = 0
+        for txt in texts:
+            res = self.client.embeddings(prompt=txt,
+                                            model=self.model_name)
+            arr.append(res["embedding"])
+            tks_num += 128
+        return np.array(arr), tks_num
+
+    def encode_queries(self, text):
+        res = self.client.embeddings(prompt=text,
+                                            model=self.model_name)
+        return np.array(res["embedding"]), 128
diff --git a/rag/svr/task_executor.py b/rag/svr/task_executor.py
index 79186487d76efa0dc7e4fe00ecd163d7ea29bb52..799d252e831c4cf312412d476c4d7db13c81f008 100644
--- a/rag/svr/task_executor.py
+++ b/rag/svr/task_executor.py
@@ -23,7 +23,8 @@ import re
 import sys
 import traceback
 from functools import partial
-
+import signal
+from contextlib import contextmanager
 from rag.settings import database_logger
 from rag.settings import cron_logger, DOC_MAXIMUM_SIZE
 
@@ -97,8 +98,21 @@ def collect(comm, mod, tm):
     cron_logger.info("TOTAL:{}, To:{}".format(len(tasks), mtm))
     return tasks
 
+@contextmanager
+def timeout(time):
+    # Register a function to raise a TimeoutError on the signal.
+    signal.signal(signal.SIGALRM, raise_timeout)
+    # Schedule the signal to be sent after ``time``.
+    signal.alarm(time)
+    yield
+
+
+def raise_timeout(signum, frame):
+    raise TimeoutError
+
 
 def build(row):
+    from timeit import default_timer as timer
     if row["size"] > DOC_MAXIMUM_SIZE:
         set_progress(row["id"], prog=-1, msg="File size exceeds( <= %dMb )" %
                      (int(DOC_MAXIMUM_SIZE / 1024 / 1024)))
@@ -111,11 +125,14 @@ def build(row):
         row["to_page"])
     chunker = FACTORY[row["parser_id"].lower()]
     try:
-        cron_logger.info(
-            "Chunkking {}/{}".format(row["location"], row["name"]))
-        cks = chunker.chunk(row["name"], binary=MINIO.get(row["kb_id"], row["location"]), from_page=row["from_page"],
+        st = timer()
+        with timeout(30):
+            binary = MINIO.get(row["kb_id"], row["location"])
+        cks = chunker.chunk(row["name"], binary=binary, from_page=row["from_page"],
                             to_page=row["to_page"], lang=row["language"], callback=callback,
                             kb_id=row["kb_id"], parser_config=row["parser_config"], tenant_id=row["tenant_id"])
+        cron_logger.info(
+            "Chunkking({}) {}/{}".format(timer()-st, row["location"], row["name"]))
     except Exception as e:
         if re.search("(No such file|not found)", str(e)):
             callback(-1, "Can not find file <%s>" % row["name"])