From b6887a20f8e953b18c078370bb1b330eb2dfb61d Mon Sep 17 00:00:00 2001
From: KevinHuSh <kevinhu.sh@gmail.com>
Date: Mon, 8 Apr 2024 19:59:31 +0800
Subject: [PATCH] Support new feature about Ollama (#262)

### What problem does this PR solve?

Issue link:#221

### Type of change

- [x] New Feature (non-breaking change which adds functionality)
---
 README.md                    |  4 +++-
 README_ja.md                 |  4 +++-
 README_zh.md                 |  4 +++-
 api/apps/conversation_app.py | 13 ++++++++-----
 4 files changed, 17 insertions(+), 8 deletions(-)

diff --git a/README.md b/README.md
index 9ef33c0..7b3e6bb 100644
--- a/README.md
+++ b/README.md
@@ -101,6 +101,7 @@
 
    ```bash
    $ cd ragflow/docker
+   $ chmod +x ./entrypoint.sh
    $ docker compose up -d
    ```
 
@@ -165,12 +166,13 @@ $ git clone https://github.com/infiniflow/ragflow.git
 $ cd ragflow/
 $ docker build -t infiniflow/ragflow:v1.0 .
 $ cd ragflow/docker
+$ chmod +x ./entrypoint.sh
 $ docker compose up -d
 ```
 
 ## đź†• Latest Features
 
-- Support [Ollam](./docs/ollama.md) for local LLM deployment.
+- Support [Ollama](./docs/ollama.md) for local LLM deployment.
 - Support Chinese UI.
 
 ## đź“ś Roadmap
diff --git a/README_ja.md b/README_ja.md
index 8437beb..2c5f50f 100644
--- a/README_ja.md
+++ b/README_ja.md
@@ -101,6 +101,7 @@
 
    ```bash
    $ cd ragflow/docker
+   $ chmod +x ./entrypoint.sh
    $ docker compose up -d
    ```
 
@@ -165,12 +166,13 @@ $ git clone https://github.com/infiniflow/ragflow.git
 $ cd ragflow/
 $ docker build -t infiniflow/ragflow:v1.0 .
 $ cd ragflow/docker
+$ chmod +x ./entrypoint.sh
 $ docker compose up -d
 ```
 
 ## đź†• ćś€ć–°ă®ć–°ć©źč˝
 
-- [Ollam](./docs/ollama.md) ă‚’ä˝żç”¨ă—ăźĺ¤§č¦Źć¨ˇă˘ă‡ă«ă®ăăĽă‚«ă©ă‚¤ă‚şă•ă‚Śăźă‡ă—ăă‚¤ăˇăłăă‚’ă‚µăťăĽăă—ăľă™ă€‚
+- [Ollama](./docs/ollama.md) ă‚’ä˝żç”¨ă—ăźĺ¤§č¦Źć¨ˇă˘ă‡ă«ă®ăăĽă‚«ă©ă‚¤ă‚şă•ă‚Śăźă‡ă—ăă‚¤ăˇăłăă‚’ă‚µăťăĽăă—ăľă™ă€‚
 - ä¸ĺ›˝čŞžă‚¤ăłă‚żăĽă•ă‚§ăĽă‚ąă‚’ă‚µăťăĽăă—ăľă™ă€‚
 
 ## đź“ś ăăĽă‰ăžăă—
diff --git a/README_zh.md b/README_zh.md
index eec642e..21c93cd 100644
--- a/README_zh.md
+++ b/README_zh.md
@@ -101,6 +101,7 @@
 
    ```bash
    $ cd ragflow/docker
+   $ chmod +x ./entrypoint.sh
    $ docker compose -f docker-compose-CN.yml up -d
    ```
 
@@ -165,12 +166,13 @@ $ git clone https://github.com/infiniflow/ragflow.git
 $ cd ragflow/
 $ docker build -t infiniflow/ragflow:v1.0 .
 $ cd ragflow/docker
+$ chmod +x ./entrypoint.sh
 $ docker compose up -d
 ```
 
 ## đź†• ćś€čż‘ć–°ç‰ąć€§
 
-- ć”ŻćŚç”¨ [Ollam](./docs/ollama.md) ĺŻąĺ¤§ć¨ˇĺž‹čż›čˇŚćś¬ĺś°ĺŚ–é¨ç˝˛ă€‚
+- ć”ŻćŚç”¨ [Ollama](./docs/ollama.md) ĺŻąĺ¤§ć¨ˇĺž‹čż›čˇŚćś¬ĺś°ĺŚ–é¨ç˝˛ă€‚
 - ć”ŻćŚä¸ć–‡ç•Śéť˘ă€‚
 
 ## đź“ś č·Żçşżĺ›ľ
diff --git a/api/apps/conversation_app.py b/api/apps/conversation_app.py
index 42339e1..6ece253 100644
--- a/api/apps/conversation_app.py
+++ b/api/apps/conversation_app.py
@@ -20,7 +20,7 @@ from flask_login import login_required
 from api.db.services.dialog_service import DialogService, ConversationService
 from api.db import LLMType
 from api.db.services.knowledgebase_service import KnowledgebaseService
-from api.db.services.llm_service import LLMService, LLMBundle
+from api.db.services.llm_service import LLMService, LLMBundle, TenantLLMService
 from api.settings import access_logger, stat_logger, retrievaler, chat_logger
 from api.utils.api_utils import server_error_response, get_data_error_result, validate_request
 from api.utils import get_uuid
@@ -184,8 +184,11 @@ def chat(dialog, messages, **kwargs):
     assert messages[-1]["role"] == "user", "The last content of this conversation is not from user."
     llm = LLMService.query(llm_name=dialog.llm_id)
     if not llm:
-        raise LookupError("LLM(%s) not found" % dialog.llm_id)
-    llm = llm[0]
+        llm = TenantLLMService.query(tenant_id=dialog.tenant_id, llm_name=dialog.llm_id)
+        if not llm:
+            raise LookupError("LLM(%s) not found" % dialog.llm_id)
+        max_tokens = 1024
+    else: max_tokens = llm[0].max_tokens
     questions = [m["content"] for m in messages if m["role"] == "user"]
     embd_mdl = LLMBundle(dialog.tenant_id, LLMType.EMBEDDING)
     chat_mdl = LLMBundle(dialog.tenant_id, LLMType.CHAT, dialog.llm_id)
@@ -227,11 +230,11 @@ def chat(dialog, messages, **kwargs):
     gen_conf = dialog.llm_setting
     msg = [{"role": m["role"], "content": m["content"]}
            for m in messages if m["role"] != "system"]
-    used_token_count, msg = message_fit_in(msg, int(llm.max_tokens * 0.97))
+    used_token_count, msg = message_fit_in(msg, int(max_tokens * 0.97))
     if "max_tokens" in gen_conf:
         gen_conf["max_tokens"] = min(
             gen_conf["max_tokens"],
-            llm.max_tokens - used_token_count)
+            max_tokens - used_token_count)
     answer = chat_mdl.chat(
         prompt_config["system"].format(
             **kwargs), msg, gen_conf)
-- 
GitLab