From 30846c83b2929c0a5b09036aed7f34e003cb7b44 Mon Sep 17 00:00:00 2001 From: balibabu <cike8899@users.noreply.github.com> Date: Wed, 17 Apr 2024 11:51:01 +0800 Subject: [PATCH] feat: modify the description of qa (#406) ### What problem does this PR solve? feat: modify the description of qa Issue link: #405 ### Type of change - [x] Bug Fix (non-breaking change which fixes an issue) --- web/src/locales/en.ts | 32 +++++++++++++++++-------- web/src/locales/zh-traditional.ts | 39 ++++++++++++++++++------------ web/src/locales/zh.ts | 40 +++++++++++++++++++------------ 3 files changed, 71 insertions(+), 40 deletions(-) diff --git a/web/src/locales/en.ts b/web/src/locales/en.ts index 07c61f4..dafe2a0 100644 --- a/web/src/locales/en.ts +++ b/web/src/locales/en.ts @@ -171,7 +171,7 @@ export default { methodTitle: 'Chunking Method Description', methodExamples: 'Examples', methodExamplesDescription: - 'This visual guides is in order to make understanding easier for you.', + 'The following screenshots are presented to facilitate understanding.', dialogueExamplesTitle: 'Dialogue Examples', methodEmpty: 'This will display a visual explanation of the knowledge base categories', @@ -201,15 +201,27 @@ export default { presentation: `<p>The supported file formats are <b>PDF</b>, <b>PPTX</b>.</p><p> Every page will be treated as a chunk. And the thumbnail of every page will be stored.</p><p> <i>All the PPT files you uploaded will be chunked by using this method automatically, setting-up for every PPT file is not necessary.</i></p>`, - qa: `<p><b>EXCEL</b> and <b>CSV/TXT</b> files are supported.</p><p> - If the file is in excel format, there should be 2 columns question and answer without header. - And question column is ahead of answer column. - And it's O.K if it has multiple sheets as long as the columns are rightly composed.</p><p> - - If it's in csv format, it should be UTF-8 encoded. Use TAB as delimiter to separate question and answer.</p><p> - - <i>All the deformed lines will be ignored. - Every pair of Q&A will be treated as a chunk.</i></p>`, + qa: ` + <p> + This chunk method supports <b>EXCEL</b> and <b>CSV/TXT</b> file formats. + </p> + <li> + If the file is in <b>Excel</b> format, it should consist of two columns + without headers: one for questions and the other for answers, with the + question column preceding the answer column. Multiple sheets are + acceptable as long as the columns are correctly structured. + </li> + <li> + If the file is in <b>CSV/TXT</b> format, it must be UTF-8 encoded with TAB + used as the delimiter to separate questions and answers. + </li> + <p> + <i> + Lines of texts that fail to follow the above rules will be ignored, and + each Q&A pair will be considered a distinct chunk. + </i> + </p> + `, resume: `<p>The supported file formats are <b>DOCX</b>, <b>PDF</b>, <b>TXT</b>. </p><p> The rĂ©sumĂ© comes in a variety of formats, just like a person’s personality, but we often have to organize them into structured data that makes it easy to search. diff --git a/web/src/locales/zh-traditional.ts b/web/src/locales/zh-traditional.ts index 6ea310d..f469759 100644 --- a/web/src/locales/zh-traditional.ts +++ b/web/src/locales/zh-traditional.ts @@ -144,12 +144,12 @@ export default { languagePlaceholder: '請輸入語言', permissions: '權é™', embeddingModel: '嵌入模型', - chunkTokenNumber: '塊令牌數', - chunkTokenNumberMessage: '塊令牌數ćŻĺż…ĺˇ«é …', + chunkTokenNumber: '塊Token數', + chunkTokenNumberMessage: '塊Token數ćŻĺż…ĺˇ«é …', embeddingModelTip: '用於嵌入塊的嵌入模型。一旦知č庫有了塊,ĺ®ĺ°±ç„ˇćł•ć›´ć”ąă€‚ĺ¦‚ćžśä˝ ćłć”ąč®Šĺ®ďĽŚä˝ 需č¦ĺŞé™¤ć‰€ćś‰çš„塊。', permissionsTip: '如果權é™ćŻâ€śĺśéšŠâ€ťďĽŚĺ‰‡ć‰€ćś‰ĺśéšŠć員é˝ĺŹŻä»Ąć“Ťä˝śçźĄč庫。', - chunkTokenNumberTip: 'ĺ®ĺ¤§č‡´ç˘şĺ®šäş†ä¸€ĺ€‹ĺˇŠçš„令牌數量。', + chunkTokenNumberTip: 'ĺ®ĺ¤§č‡´ç˘şĺ®šäş†ä¸€ĺ€‹ĺˇŠçš„Token數量。', chunkMethod: '解ćžć–ąćł•', chunkMethodTip: '說ćŽä˝Ťć–ĽĺŹłĺ´ă€‚', upload: '上傳', @@ -163,7 +163,7 @@ export default { cancel: '取ć¶', methodTitle: 'ĺ†ĺˇŠć–ąćł•čŞŞćŽ', methodExamples: '示例', - methodExamplesDescription: '這個視覺指南ćŻç‚şäş†č®“您更容ć“ç†č§Łă€‚', + methodExamplesDescription: 'ćŹĺ‡şä»Ąä¸‹ĺ±Źĺą•ćŞĺś–以äżé€˛ç†č§Łă€‚', dialogueExamplesTitle: '對話示例', methodEmpty: '這將顯示知č庫類ĺĄçš„可視化解釋', book: `<p>支ćŚçš„ć–‡ä»¶ć ĽĺĽŹç‚ş<b>DOCX</b>ă€<b>PDF</b>ă€<b>TXT</b>。</p><p> @@ -182,7 +182,7 @@ export default { <p>ć¤ć–ąćł•ĺ°‡ç°ˇĺ–®çš„方法應用於塊文件:</p> <p> <li>系統將使用視覺檢測模型將連續文本ĺ†ĺ‰˛ć多個片段。</li> - <li>接下來,這些連續的片段被ĺ併ć令牌數不超éŽâ€śä»¤ç‰Ść•¸â€ťçš„塊。</li></p>`, + <li>接下來,這些連續的片段被ĺ併ćToken數不超éŽâ€śToken數”的塊。</li></p>`, paper: `<p>ĺ…支ćŚ<b>PDF</b>文件。</p><p> 如果ć‘們的模型é‹čˇŚč‰ŻĺĄ˝ďĽŚč«–文將按其é¨ĺ†é€˛čˇŚĺ‡ç‰‡ďĽŚäľ‹ĺ¦‚<i>ć‘č¦ă€1.1ă€1.2</i>ç‰ă€‚</p><p> 這樣ĺšçš„好處ćŻLLM可以更好的概括論文ä¸ç›¸é—śç« 節的內容, @@ -192,15 +192,24 @@ export default { presentation: `<p>支ćŚçš„ć–‡ä»¶ć ĽĺĽŹç‚ş<b>PDF</b>ă€<b>PPTX</b>。</p><p> 每個é 面é˝ĺ°‡č˘«č¦–為一個塊。並且每個é 面的縮略圖é˝ćśč˘«ĺ儲。</p><p> <i>您上傳的所有PPT文件é˝ćśä˝żç”¨ć¤ć–ąćł•č‡Şĺ‹•ĺ†ĺˇŠďĽŚç„ˇéś€ç‚şćŻŹĺ€‹PPT文件進行č¨ç˝®ă€‚</i></p>`, - qa: `支ćŚ<p><b>EXCEL</b>ĺ’Ś<b>CSV/TXT</b>文件。</p><p> - 如果文件ćŻExcelć ĽĺĽŹďĽŚć‡‰č©˛ćś‰2ĺ—問題和ç”ćˇďĽŚć˛’有標題。 - 問題欄位於ç”ćˇć¬„之前。 - 如果有多個工作表也沒關係,只č¦ĺ—的組ĺćŁç˘şĺŤłĺŹŻă€‚</p><p> - - ĺ¦‚ćžśćŻ csv ć ĽĺĽŹďĽŚĺ‰‡ć‡‰ćŽˇç”¨ UTF-8 編碼。使用 TAB 作為ĺ†éš”符來ĺ†éš”問題和ç”ćˇă€‚</p><p> - - <i>所有變形的線é˝ĺ°‡č˘«ĺż˝ç•Ąă€‚ - 每對問ç”é˝ĺ°‡č˘«č¦–為一個塊。</i></p>`, + qa: `<p> + ć¤ĺˇŠć–ąćł•ć”ŻćŚ<b> excel </b>ĺ’Ś<b> csv/txt </b>ć–‡ä»¶ć ĽĺĽŹă€‚ + </p> + <li> + 如果文件以<b> excel </b>ć ĽĺĽŹďĽŚĺ‰‡ć‡‰ç”±ĺ…©ĺ€‹ĺ—組ć + 沒有標題:一個ćŹĺ‡şĺ•ŹéˇŚďĽŚĺŹ¦ä¸€ĺ€‹ç”¨ć–Ľç”ćˇďĽŚ + ç”ćˇĺ—之前的問題ĺ—ă€‚ĺ¤šĺĽµç´™ćŻ + 只č¦ĺ—ćŁç˘şçµć§‹ďĽŚĺ°±ĺŹŻä»ĄćŽĄĺŹ—。 + </li> + <li> + 如果文件以<b> csv/txt </b>ć ĽĺĽŹç‚ş + 用作ĺ†é–‹ĺ•ŹéˇŚĺ’Śç”ćˇçš„定界符。 + </li> + <p> + <i> + 未č˝éµĺľŞä¸Ščż°č¦Źĺ‰‡çš„文本行將被忽略,並且 + 每個問ç”對將被認為ćŻä¸€ĺ€‹çŤ¨ç‰ąçš„é¨ĺ†ă€‚ + </i>`, resume: `<p>支ćŚçš„ć–‡ä»¶ć ĽĺĽŹç‚ş<b>DOCX</b>ă€<b>PDF</b>ă€<b>TXT</b>。 </p><p> ç°ˇć·ćś‰ĺ¤šç¨®ć ĽĺĽŹďĽŚĺ°±ĺŹä¸€ĺ€‹äşşçš„個性一樣,但ć‘們經常必é ĺ°‡ĺ®ĺ€‘組織ćçµć§‹ĺŚ–數據,以便於ćśç´˘ă€‚ @@ -414,7 +423,7 @@ export default { 202: '一個請求已經進入後台排隊ďĽç•°ćĄä»»ĺ‹™ďĽ‰ă€‚', 204: 'ĺŞé™¤ć•¸ć“šć功。', 400: '發出的請求有錯誤,服務器沒有進行新建ć–修改數據的操作。', - 401: '用ć¶ć˛’有權é™ďĽä»¤ç‰Śă€ç”¨ć¶ĺŤă€ĺŻ†ç˘ĽéŚŻčŞ¤ďĽ‰ă€‚', + 401: '用ć¶ć˛’有權é™ďĽTokenă€ç”¨ć¶ĺŤă€ĺŻ†ç˘ĽéŚŻčŞ¤ďĽ‰ă€‚', 403: '用ć¶ĺľ—ĺ°ćŽć¬ŠďĽŚä˝†ćŻč¨Şĺ•ŹćŻč˘«ç¦ć˘çš„。', 404: '發出的請求針對的ćŻä¸Ťĺ在的č¨éŚ„,服務器沒有進行操作。', 406: 'č«‹ć±‚çš„ć ĽĺĽŹä¸ŤĺŹŻĺľ—ă€‚', diff --git a/web/src/locales/zh.ts b/web/src/locales/zh.ts index bf97cbf..6d66234 100644 --- a/web/src/locales/zh.ts +++ b/web/src/locales/zh.ts @@ -145,12 +145,12 @@ export default { languagePlaceholder: '请输入čŻč¨€', permissions: 'ćťé™', embeddingModel: '嵌入模型', - chunkTokenNumber: '块令牌数', - chunkTokenNumberMessage: '块令牌数ćŻĺż…填项', + chunkTokenNumber: 'ĺť—Tokenć•°', + chunkTokenNumberMessage: 'ĺť—Tokenć•°ćŻĺż…填项', embeddingModelTip: '用于嵌入块的嵌入模型。 一旦知识库有了块,ĺ®ĺ°±ć— 法更改。 ĺ¦‚ćžśä˝ ćłć”ąĺŹĺ®ďĽŚä˝ 需č¦ĺ 除所有的块。', permissionsTip: '如果ćťé™ćŻâ€śĺ›˘éźâ€ťďĽŚĺ™ć‰€ćś‰ĺ›˘éźćĺ‘é˝ĺŹŻä»Ąć“Ťä˝śçźĄčŻ†ĺş“。', - chunkTokenNumberTip: 'ĺ®ĺ¤§č‡´çˇ®ĺ®šäş†ä¸€ä¸Şĺť—的令牌数量。', + chunkTokenNumberTip: 'ĺ®ĺ¤§č‡´çˇ®ĺ®šäş†ä¸€ä¸Şĺť—çš„Token数量。', chunkMethod: '解ćžć–ąćł•', chunkMethodTip: '说ćŽä˝ŤäşŽĺŹłäľ§ă€‚', upload: 'ä¸ŠäĽ ', @@ -164,7 +164,7 @@ export default { cancel: '取ć¶', methodTitle: 'ĺ†ĺť—方法说ćŽ', methodExamples: '示例', - methodExamplesDescription: '这个视觉指南ćŻä¸şäş†č®©ć‚¨ć›´ĺ®ąć“ç†č§Łă€‚', + methodExamplesDescription: 'ćŹĺ‡şä»Ąä¸‹ĺ±Źĺą•ćŞĺ›ľä»Ąäżčż›ç†č§Łă€‚', dialogueExamplesTitle: '对话示例', methodEmpty: '这将ćľç¤şçźĄčŻ†ĺş“ç±»ĺ«çš„可视化解释', book: `<p>支ćŚçš„ć–‡ä»¶ć ĽĺĽŹä¸ş<b>DOCX</b>ă€<b>PDF</b>ă€<b>TXT</b>。</p><p> @@ -183,7 +183,7 @@ export default { <p>ć¤ć–ąćł•ĺ°†ç®€ĺŤ•çš„方法应用于块文件:</p> <p> <li>系统将使用视觉检测模型将连ç»ć–‡ćś¬ĺ†ĺ‰˛ć多个片段。</li> - <li>接下来,这些连ç»çš„片段被ĺ并ć令牌数不超过“令牌数”的块。</li></p>`, + <li>接下来,这些连ç»çš„片段被ĺ并ćToken数不超过“Token数”的块。</li></p>`, paper: `<p>仅支ćŚ<b>PDF</b>文件。</p><p> 如果ć‘们的模型čżčˇŚč‰ŻĺĄ˝ďĽŚč®şć–‡ĺ°†ćŚ‰ĺ…¶é¨ĺ†čż›čˇŚĺ‡ç‰‡ďĽŚäľ‹ĺ¦‚<i>ć‘č¦ă€1.1ă€1.2</i>ç‰ă€‚</p><p> čż™ć ·ĺšçš„好处ćŻLLM可以更好的概括论文ä¸ç›¸ĺ…łç« 节的内容, @@ -193,15 +193,25 @@ export default { presentation: `<p>支ćŚçš„ć–‡ä»¶ć ĽĺĽŹä¸ş<b>PDF</b>ă€<b>PPTX</b>。</p><p> 每个页面é˝ĺ°†č˘«č§†ä¸şä¸€ä¸Şĺť—。 并且每个页面的缩略图é˝äĽšč˘«ĺ储。</p><p> <i>ć‚¨ä¸ŠäĽ çš„ć‰€ćś‰PPT文件é˝äĽšä˝żç”¨ć¤ć–ąćł•č‡ŞĺŠ¨ĺ†ĺť—ďĽŚć— éś€ä¸şćŻŹä¸ŞPPT文件进行设置。</i></p>`, - qa: `支ćŚ<p><b>EXCEL</b>ĺ’Ś<b>CSV/TXT</b>文件。</p><p> - 如果文件ćŻExcelć ĽĺĽŹďĽŚĺş”čŻĄćś‰2ĺ—é—®é˘ĺ’Śç”ćˇďĽŚć˛ˇćś‰ć ‡é˘ă€‚ - é—®é˘ć Źä˝ŤäşŽç”ćˇć Źäą‹ĺ‰Ťă€‚ - 如果有多个工作表也没关系,只č¦ĺ—的组ĺćŁçˇ®ĺŤłĺŹŻă€‚</p><p> - - ĺ¦‚ćžśćŻ csv ć ĽĺĽŹďĽŚĺ™ĺş”采用 UTF-8 编ç 。 使用 TAB 作为ĺ†éš”符来ĺ†éš”é—®é˘ĺ’Śç”ćˇă€‚</p><p> - - <i>所有ĺŹĺ˝˘çš„çşżé˝ĺ°†č˘«ĺż˝ç•Ąă€‚ - 每对问ç”é˝ĺ°†č˘«č§†ä¸şä¸€ä¸Şĺť—。</i></p>`, + qa: ` <p> + ć¤ĺť—方法支ćŚ<b> excel </b>ĺ’Ś<b> csv/txt </b>ć–‡ä»¶ć ĽĺĽŹă€‚ + </p> + <li> + 如果文件以<b> excel </b>ć ĽĺĽŹďĽŚĺ™ĺş”由两个ĺ—组ć + ć˛ˇćś‰ć ‡é˘ďĽšä¸€ä¸ŞćŹĺ‡şé—®é˘ďĽŚĺŹ¦ä¸€ä¸Şç”¨äşŽç”ćˇďĽŚ + ç”ćˇĺ—之前的问é˘ĺ—ă€‚ĺ¤šĺĽ çş¸ćŻ + 只č¦ĺ—ćŁçˇ®ç»“构,就可以接受。 + </li> + <li> + 如果文件以<b> csv/txt </b>ć ĽĺĽŹä¸ş + 用作ĺ†ĺĽ€é—®é˘ĺ’Śç”ćˇçš„定界符。 + </li> + <p> + <i> + 未č˝éµĺľŞä¸Ščż°č§„ĺ™çš„文本行将被忽略,并且 + 每个问ç”对将被认为ćŻä¸€ä¸Şç‹¬ç‰ąçš„é¨ĺ†ă€‚ + </i> + </p>`, resume: `<p>支ćŚçš„ć–‡ä»¶ć ĽĺĽŹä¸ş<b>DOCX</b>ă€<b>PDF</b>ă€<b>TXT</b>。 </p><p> ç®€ĺŽ†ćś‰ĺ¤šç§Ťć ĽĺĽŹďĽŚĺ°±ĺŹä¸€ä¸Şäşşçš„ä¸Şć€§ä¸€ć ·ďĽŚä˝†ć‘们经常必须将ĺ®ä»¬ç»„织ć结构化数据,以便于ćśç´˘ă€‚ @@ -430,7 +440,7 @@ export default { 202: '一个请求已经进入ĺŽĺŹ°ćŽ’éźďĽĺĽ‚ćĄä»»ĺŠˇďĽ‰ă€‚', 204: 'ĺ 除数据ć功。', 400: '发出的请求有错误,服务器没有进行新建ć–修改数据的操作。', - 401: '用ć·ć˛ˇćś‰ćťé™ďĽä»¤ç‰Śă€ç”¨ć·ĺŤă€ĺŻ†ç 错误)。', + 401: '用ć·ć˛ˇćś‰ćťé™ďĽTokenă€ç”¨ć·ĺŤă€ĺŻ†ç 错误)。', 403: '用ć·ĺľ—ĺ°ćŽćťďĽŚä˝†ćŻč®żé—®ćŻč˘«ç¦ć˘çš„。', 404: '发出的请求é’对的ćŻä¸Ťĺ在的记录,服务器没有进行操作。', 406: 'čŻ·ć±‚çš„ć ĽĺĽŹä¸ŤĺŹŻĺľ—ă€‚', -- GitLab