GishB
diff --git a/‎.env.example
Lines changed: 4 additions & 1 deletion b/‎.env.example
Lines changed: 4 additions & 1 deletion
diff --git a/‎.env.prod.example
Lines changed: 4 additions & 1 deletion b/‎.env.prod.example
Lines changed: 4 additions & 1 deletion
diff --git a/‎nginx/nginx.conf
Lines changed: 16 additions & 0 deletions b/‎nginx/nginx.conf
Lines changed: 16 additions & 0 deletions
diff --git a/‎prompts/assistant_prompt.txt
Lines changed: 3 additions & 2 deletions b/‎prompts/assistant_prompt.txt
Lines changed: 3 additions & 2 deletions
diff --git a/‎prompts/default_prompt.txt
Lines changed: 9 additions & 7 deletions b/‎prompts/default_prompt.txt
Lines changed: 9 additions & 7 deletions
diff --git a/‎setup.py
Lines changed: 1 addition & 1 deletion b/‎setup.py
Lines changed: 1 addition & 1 deletion
diff --git a/‎src/UnionChatBot/CoreLogic.py
Lines changed: 147 additions & 0 deletions b/‎src/UnionChatBot/CoreLogic.py
Lines changed: 147 additions & 0 deletions
diff --git a/‎src/UnionChatBot/utils/BasicManager.py
Lines changed: 97 additions & 0 deletions b/‎src/UnionChatBot/utils/BasicManager.py
Lines changed: 97 additions & 0 deletions
@@ -4,13 +4,16 @@ export FOLDER_ID="x1ue823jv1ws48cloudy1"
 export API_KEY="QWJEJ48m6LfUEggPbmocHmW00JJgpZNetSv_NaZZaret"
 export EMBEDDING_API="https://llm.api.cloud.yandex.net:443/foundationModels/v1/textEmbedding"
 export YANDEXGPT_API="https://llm.api.cloud.yandex.net/foundationModels/v1/completion"
-export COLLECTION_NAME="profkom_documents_yandex_emb_and_tiktoken_ru"
+export COLLECTION_NAME="default_collection"
 export UNIQUE_BOT_ID="41823841384:FF1I2RagnarekC4MAyBEF9kWvAAqaaabWRRN1oOOPr"
 export DEFAULT_PROMPT_FILE="default_prompt.txt"
 export DEFAULT_DIR_PROMPT="./prompts"
 export MAX_HISTORY_USER_LENGTH=10
 export HISTORY_USER_TTL_DAYS=7
+export TOP_K_DOCUMENTS=5
+export MAX_RAG_DOCUMENTS=20
 export MAX_FASTAPI_THREADS=10
+export TIME_SLEEP_RATE_EMBEDDER=0.01
 export CHROMA_HOST="127.0.0.1"
 export REDIS_HOST="127.0.0.1"
 export CHROMA_PORT="8000"
 
@@ -2,13 +2,16 @@ FOLDER_ID="x1ue823jv1ws48cloudy1"
 API_KEY="QWJEJ48m6LfUEggPbmocHmW00JJgpZNetSv_NaZZaret"
 EMBEDDING_API="https://llm.api.cloud.yandex.net:443/foundationModels/v1/textEmbedding"
 YANDEXGPT_API="https://llm.api.cloud.yandex.net/foundationModels/v1/completion"
-COLLECTION_NAME="profkom_documents_yandex_emb_and_tiktoken_ru"
+COLLECTION_NAME="default_collection"
 UNIQUE_BOT_ID="41823841384:FF1I2RagnarekC4MAyBEF9kWvAAqaaabWRRN1oOOPr"
 DEFAULT_PROMPT_FILE="default_prompt.txt"
 DEFAULT_DIR_PROMPT="./prompts"
 MAX_HISTORY_USER_LENGTH=10
 HISTORY_USER_TTL_DAYS=7
+TOP_K_DOCUMENTS=5
+MAX_RAG_DOCUMENTS=20
 MAX_FASTAPI_THREADS=10
+TIME_SLEEP_RATE_EMBEDDER=0.01
 CHROMA_HOST="chromadb"
 REDIS_HOST="redis"
 CHROMA_PORT="8000"
 
@@ -33,6 +33,22 @@ http {
     # Ban status mapping - more selective
     map $status $is_banned_status {
         default 0;
+        400 1;
+        401 1;
+        402 1;
+        403 1;
+        404 1;
+        405 1;
+        406 1;
+        407 1;
+        408 1;
+        409 1;
+        422 1;
+        423 1;
+        424 1;
+        425 1;
+        426 1;
+        428 1;
         429 1;
     }
 
 
@@ -5,5 +5,6 @@
 
 Твои ограничения и возможности:
 
-1. Разрешено модифицировать, перефразировать и дополнять вопрос;
-2. Разрешено использовать историю диалога с пользователем для того, чтобы узнать чего он хочет.
+1. Разрешено перефразировать по стилю и дополнять вопрос исходя из истории поиска;
+2. Разрешено использовать историю диалога с пользователем для того, чтобы узнать какой вопрос он задает.
+3. Нельзя полностью изменять текущий вопрос пользователя!
@@ -6,9 +6,9 @@
 
 1. Если ты не знаешь ответ, то ты не придумываешь ответ!
 2. Ты обязан следовать формату ответа на вопрос пользователя.
-3. Если считаешь, что вопрос пользователя был неконкретным или общим, то помоги ему правильно сформировать вопрос.
-4. Если информации недостаточно для ответа, то посмотри на историю последнего диалога с пользователем.
-5. Ответ давай наиболее коротко и по делу, чтобы с первого ответа пользователю стало понятно.
+3. Если информации недостаточно для ответа, то посмотри на историю последнего диалога с пользователем в разделе <История диалога с пользователем>.
+4. Ответ давай наиболее коротко и по делу. Старайся информацию выдавать в стиле профессионального юрист консультанта.
+5. Обязательно помогай пользователю найти информацию на свой вопрос. Рекомендуй ему дальнейшие шаги, чтобы найти ответ на вопрос.
 
 Следуй следующему формату сообщений, далее ФОРМАТ:
 
@@ -18,8 +18,10 @@
 Ответ: "Тут содержится ответа на вопрос пользователя. А тут дается информация с приложенной ссылкой [0]".
 (ОБЯЗАТЕЛЬНО ДАЙ ОТВЕТ В ЭТОМ ФОРМАТЕ)
 
-Источник(и):
-№0 (номер порядковый из RAG) - информация получена из файла TEXT,
-относится к пункту документа TEXT (указана URL, название файла и\или информация из <Источник>),
-название документа TEXT
+Источник(и): (Если источник не существует, то не надо придумывать их!)
+
+№0 (номер порядковый из RAG если есть что-то для ответа):
+ - название документа (как называется сам документ к которому относится данная информация);
+ - относится к пункту документа (укажи пункт в котором встречается данный текст => указана URL, название файла и\или информация из <Источник>);
+ - информация получена из файла (укажи название файла);
 -------------------------</ФОРМАТ>-----------------------------------------
@@ -1,6 +1,6 @@
 from setuptools import setup, find_packages
 
-__version__ = "0.1.0"
+__version__ = "0.2.1"
 
 # Read requirements from requirements.txt
 with open("requirements.txt") as f:
 
@@ -0,0 +1,147 @@
+import json
+import os
+from typing import Optional
+
+import requests
+
+from UnionChatBot.utils.BasicManager import BasicManager
+from UnionChatBot.utils.EmbeddingAPI import MyEmbeddingFunction
+from UnionChatBot.utils.ChromaAdapter import ChromaAdapter
+from UnionChatBot.utils.RedisAdapters import SemanticRedisCache
+from UnionChatBot.utils.ChatHistoryManager import ChatHistoryManager
+from UnionChatBot.utils.QueryRewriteManager import QueryRewriteManager
+
+
+class CoreQueryProcessor(BasicManager):
+    """Центральный класс позволяющий реализовать логику работы чат-бота.
+
+    Args:
+        embedding_function: объект класса отвечающий за векторизацию текста.
+        chroma_adapter: объект класса отвечающий за взаимодействие с векторной БД.
+        redis_cache: объект класса отвечающий за взаимодействие с горячей БД Redis.
+        chat_manager: объект класса отвечающий за контроль истории пользователя при общении с чат-ботом.
+    """
+
+    core_prompt_file = os.getenv("DEFAULT_PROMPT_FILE", "default_prompt.txt")
+    core_prompt_dir = os.getenv("DEFAULT_DIR_PROMPT", "./prompts")
+
+    def __init__(
+        self,
+        temperature: float = 0.3,
+        stream: bool = False,
+        maxTokens: int = 2000,
+        model_name: str = "deepseek-r1-distill-qwen-32b",
+        embedding_function: MyEmbeddingFunction = None,
+        chroma_adapter: ChromaAdapter = None,
+        redis_cache: SemanticRedisCache = None,
+        chat_manager: ChatHistoryManager = None,
+        query_rewriter: Optional[QueryRewriteManager] = None,
+        **kwargs,
+    ):
+        super().__init__(
+            model_name=model_name,
+            temperature=temperature,
+            stream=stream,
+            maxTokens=maxTokens,
+            **kwargs,
+        )
+
+        self.embedding_function = embedding_function
+        self.redis_cache = redis_cache
+        self.chroma_adapter = chroma_adapter
+        self.chat_manager = chat_manager
+        self.query_rewriter = query_rewriter
+
+    def modify_system_prompt(self, prompt: str, data: dict, user_id: str) -> str:
+        """Модифицируем системный промт исходя из ответов из базы данных.
+
+        Args:
+            prompt: системый промт по умолчанию.
+            data: словарь с релевантной информацией из БД.
+            user_id: уникальный индетефикатор пользователя.
+
+        Return:
+            Модифицированный системный промт исходя из дополнительной информации из БД и истории диалога.
+        """
+        history_data = self.chat_manager.get_formatted_history(user_id=user_id)
+        prompt += "<RAG>"
+        context = (
+            " ".join(
+                [
+                    "№"
+                    + str(idx)
+                    + " <Информация>: "
+                    + info[0]
+                    + " "
+                    + "<Источник>: "
+                    + info[1].get(list(info[1].keys())[0])
+                    + " </Источник> <Файл> "
+                    + list(info[1].keys())[0]
+                    + "</Файл>"
+                    + "</Информация> \n"
+                    for idx, info in enumerate(
+                        zip(data.get("documents"), data.get("metadatas"))
+                    )
+                ]
+            )
+            + "</RAG>"
+        )
+        prompt += " " + context + history_data
+        return prompt
+
+    def ask(self, query: str, collection_name: str, user_id: str) -> str:
+        """Инициализация диалога с чат-ботом.
+
+        Args:
+            query: вопрос пользователя & сообщение.
+            collection_name: название коллекции к которой необходимо обратиться в ChromaDB.
+            user_id: уникальный идентификатор пользователя.
+
+        Return:
+            Текстовый ответ модели для пользователя.
+        """
+        system_prompt = self.read_prompt(
+            prompt_file=self.core_prompt_file, prompt_dir=self.core_prompt_dir
+        )
+
+        if self.query_rewriter:
+            query, status = self.query_rewriter.rewrite(query=query, user_id=user_id)
+            if status != 200:
+                return query
+
+        query_embedding = self.embedding_function(query)
+
+        cached = self.redis_cache.get(query, query_embedding)
+        if cached:
+            self.chat_manager.add_message_to_history(
+                user_id=user_id, message=cached["response"]
+            )
+            return cached["response"]
+
+        data = self.chroma_adapter.get_info(
+            query=query, collection_name=collection_name
+        )
+        new_prompt = self.modify_system_prompt(
+            prompt=system_prompt, data=data, user_id=user_id
+        )
+        response = requests.post(
+            url=self.url,
+            headers=self.setup_header(),
+            data=self.setup_data(text=query, prompt=new_prompt),
+        )
+
+        if response.status_code == 200:
+            dict_response = json.loads(response.content)
+            answer = (
+                dict_response.get("result")
+                .get("alternatives")[0]
+                .get("message")
+                .get("text")
+            )
+            self.redis_cache.set(query, query_embedding, answer)
+            self.chat_manager.add_message_to_history(user_id=user_id, message=answer)
+        else:
+            answer = (
+                f"Код ответа {response.status_code}. Попробуйте задать вопрос позднее."
+            )
+        return answer
@@ -0,0 +1,97 @@
+import json
+import os
+
+
+class BasicManager:
+    """Базовые возможности менеджера запросов к YandexGPTAPI.
+
+    Args:
+        temperature: температура с которой генерируются ответы модели.
+        stream: необходимость возвращать ответ посимвольно.
+        maxTokens: ограничение на кол-во токенов для модели суммарно генерация + ответ.
+        folder_id: секрет принадлежащий сервисному аккаунту Yandex GPT API.
+        api_key: секрет принадлежащий сервисному аккаунту Yandex GPT API.
+        url: ссылка на YandexGPTAPI inference.
+        model_name: модель используемая для генерации ответа.
+    """
+
+    url = os.getenv(
+        "YANDEXGPT_API",
+        "https://llm.api.cloud.yandex.net/foundationModels/v1/completion",
+    )
+    folder_id = os.getenv("FOLDER_ID", None)
+    api_key = os.getenv("API_KEY", None)
+
+    def __init__(
+        self,
+        model_name: str,
+        maxTokens: str = "8000",
+        stream: bool = False,
+        temperature: float = 0.3,
+        **kwargs,
+    ):
+        self.stream = stream
+        self.temperature = temperature
+        self.model_name = model_name
+        self.maxTokens = maxTokens
+
+        if self.folder_id is None or self.api_key is None:
+            raise ValueError(
+                "FOLDER_ID or API_KEY hasn`t been defined at ENV! This is important parameters for YandexCloud API!"
+            )
+
+        if self.url is None:
+            raise ValueError(
+                "YANDEXGPT_API url hasn`t been defined at ENV! How you are going to inference at all???"
+            )
+
+        if maxTokens >= 8001:
+            raise Warning("It is not recommended to set more than 8000 tokens!")
+
+        if maxTokens >= 32000:
+            raise Warning(
+                "You set limited maxTokens rate based on YandexAPI docs at 2025!"
+            )
+
+    def setup_header(self) -> dict:
+        """Генерируем классический Header запроса.
+
+        Return:
+            Требуемого вида JSON объект в виде словаря, для корректной аунтификации на endpoint.
+        """
+        return {
+            "Content-Type": "application/json",
+            "Authorization": "Api-Key " + self.api_key,
+            "x-folder-id": self.folder_id,
+            "x-data-logging-enabled": "false",
+        }
+
+    def setup_data(self, text: str, prompt: str) -> json.dumps:
+        """Генерируем полное тело запроса для последующей генерации ответа модели.
+
+        Args:
+            text: Запрос пользователя (может быть в сыром виде);
+            prompt: Дополнительная информация для генерации правильного ответа моделью.
+
+        Return:
+            Полное тело запроса для Yandex GPT endpoint.
+        """
+        return json.dumps(
+            {
+                "modelUri": f"gpt://{self.folder_id}/{self.model_name}",
+                "completionOptions": {
+                    "stream": self.stream,
+                    "temperature": self.temperature,
+                    "maxTokens": str(self.maxTokens),
+                },
+                "messages": [
+                    {"role": "system", "text": prompt},
+                    {"role": "user", "text": text},
+                ],
+            }
+        )
+
+    @staticmethod
+    def read_prompt(prompt_file: str, prompt_dir: str) -> str:
+        with open(prompt_dir + "/" + prompt_file, "r", encoding="utf-8") as file:
+            return file.read()