ArkaNiightt
diff --git a/‎.env.exemple
+8 b/‎.env.exemple
+8
diff --git a/‎.gitignore
+6 b/‎.gitignore
+6
diff --git a/‎Home.py
+52 b/‎Home.py
+52
diff --git a/‎images/avatar_assistant.png
62.7 KB b/‎images/avatar_assistant.png
62.7 KB
diff --git a/‎images/avatar_user.png
58.4 KB b/‎images/avatar_user.png
58.4 KB
diff --git a/‎pages/Config.py
+98 b/‎pages/Config.py
+98
diff --git a/‎pages/Debug.py
+49 b/‎pages/Debug.py
+49
diff --git a/‎requirements.txt
+9 b/‎requirements.txt
+9
diff --git a/‎utils/avatar_image.py
+31 b/‎utils/avatar_image.py
+31
diff --git a/‎utils/chat_utils.py
+41 b/‎utils/chat_utils.py
+41
diff --git a/‎utils/config_utils.py
+46 b/‎utils/config_utils.py
+46
@@ -0,0 +1,8 @@
+OPENAI_API_KEY="Sua chave de API do OpenAI"
+
+## Se você não tiver uma chave de API do OpenAI, você pode obter uma em https://platform.openai.com/signup
+
+## Hugging Face API Token
+## Você pode obter um token da API Hugging Face em https://huggingface.co/join
+
+HUGGINGFACE_API_TOKEN="Seu token da API Hugging Face"
@@ -0,0 +1,6 @@
+.venv
+__pycache__
+.env
+teste.ipynb
+arquivos
+.streamlit
@@ -0,0 +1,52 @@
+import streamlit as st
+from utils.sidebar_utils import sidebar_home
+from utils.chat_utils import get_chat_mensage
+
+
+def chat_window():
+    st.header(
+        "📝 DocsTalker: Seu bate-papo com PDFs",
+        help="Chatbot para leitura de documentos PDF",
+        divider=True
+    )
+
+    if not "chain" in st.session_state:
+        st.warning("Inicialize o ChatBot para começar", icon="⚠️")
+        st.stop()
+
+    chain = st.session_state["chain"]
+    memory = chain.memory
+
+    mensagens = memory.load_memory_variables({})["chat_history"]
+
+    container = st.container()
+    for mensagem in mensagens:
+        get_chat_mensage(st, mensagem, container)
+
+    input_mensagem = st.chat_input(
+        placeholder="Converse com os seus documentos pdfs...", key="input_mensagem")
+    if input_mensagem:
+        get_chat_mensage(
+            st,
+            input_mensagem,
+            container,
+            input_mensagem,
+            chain,
+            is_input=True
+        )
+
+def app():
+    st.set_page_config(
+        page_title="DocsTalker - Chatbot para PDFs",
+        page_icon="📝",
+        layout="centered",
+        initial_sidebar_state="expanded",
+        menu_items={"Get Help": "https://www.streamlit.io/docs"}
+    )
+    with st.sidebar:
+        sidebar_home(st)
+    chat_window()
+
+
+if __name__ == "__main__":
+    app()
@@ -0,0 +1,98 @@
+import streamlit as st
+from utils.config_utils import get_config, MODEL_OPTIONS, SEARCH_TYPES
+from utils.langchain import create_chain_conversation, ARQUIVOS
+from utils.sidebar_utils import sidebar_config
+from utils.utils import start_chatbot
+
+
+def config_window() -> None:
+    """Configure the Streamlit window and chatbot parameters."""
+    st.set_page_config(
+        page_title="Configurações do Chatbot",
+        page_icon="⚙️",
+        layout="centered",
+        initial_sidebar_state="expanded",
+        menu_items={"Get Help": "https://www.streamlit.io/docs"}
+    )
+    st.header(
+        "⚙️ Configurações de Parâmetros do Chatbot",
+        help="Configurações do ChatBot para leitura de documentos PDF",
+        divider=True
+    )
+
+    model_name = st.selectbox(
+        "Modelo de Linguagem",
+        MODEL_OPTIONS,
+        index=MODEL_OPTIONS.index(get_config("model_name")),
+        key="model_name_input",
+        help="Modelo de linguagem a ser utilizado pelo ChatBot"
+    )
+
+    retrieval_search_type = st.selectbox(
+        "Tipo de Busca",
+        options=SEARCH_TYPES,
+        index=SEARCH_TYPES.index(get_config("retrieval_search_type")),
+        key="retrieval_search_type_selectbox",
+        help="Tipo de busca a ser utilizado pelo ChatBot"
+    )
+    retrieval_kwargs: dict = {}
+
+    retrieval_kwargs['k'] = st.select_slider(
+        "Número de Documentos Retornados (k) - Recomendado: 5",
+        options=list(range(1, 101)),
+        value=get_config("retrieval_kwargs")['k'],
+        key="retrieval_kwargs_k_slider",
+        help="Número de documentos mais relevantes a serem retornados",
+        on_change=lambda: st.session_state.update(
+            {"retrieval_kwargs": retrieval_kwargs})
+    )
+
+    retrieval_kwargs['fetch_k'] = st.select_slider(
+        "Número de Documentos Buscados (fetch_k) - Recomendado: 20",
+        options=list(range(1, 101)),
+        value=get_config("retrieval_kwargs")['fetch_k'],
+        key="retrieval_kwargs_fetch_k_slider",
+        help="Número total de documentos a serem buscados antes da filtragem",
+        on_change=lambda: st.session_state.update(
+            {"retrieval_kwargs": retrieval_kwargs})
+    )
+
+    prompt = st.text_area(
+        label="Prompt Template - Modelo de Prompt",
+        value=get_config("prompt"),
+        height=400,
+        key="prompt_slider",
+        help="Template de prompt a ser utilizado pelo ChatBot"
+
+    )
+
+    if st.button(
+        "Salvar Configurações",
+        key="salvar_config",
+        help="Salva as configurações do ChatBot",
+        use_container_width=True
+    ):
+        st.session_state["model_name"] = model_name
+        st.session_state["retrieval_search_type"] = retrieval_search_type
+        st.session_state["retrieval_kwargs"] = retrieval_kwargs
+        st.session_state["prompt"] = prompt
+        st.toast("Configurações Salvas com Sucesso!", icon="✔️")
+        st.rerun()
+
+    if st.button(
+        "Atualizar ChatBot", 
+        key="atualizar_chatbot",
+        help="Atualiza o ChatBot com as novas configurações",
+        type="primary",
+        use_container_width=True
+        ):
+        start_chatbot(st, ARQUIVOS, create_chain_conversation)
+
+def app() -> None:
+    """Main Streamlit application."""
+    config_window()
+    with st.sidebar:
+        sidebar_config(st)
+
+
+app()
@@ -0,0 +1,49 @@
+import streamlit as st
+from langchain.prompts import PromptTemplate
+from utils.config_utils import get_config
+
+
+def debug_window():
+    st.set_page_config(
+        page_title="Debug Window",
+        page_icon="🐞",
+        layout="centered",
+        initial_sidebar_state="expanded",
+        menu_items={
+            "Get Help": "https://www.streamlit.io/docs",
+            "Report a bug": "https://github.com/ArkaNiightt"
+        },
+    )
+    st.header(
+        "Visualização de Dados e Depuração",
+        help="Esta página é destinada a depuração e teste de funcionalidades.",
+        divider=True
+    )
+
+    prompt_template = get_config("prompt")
+    prompt_template = PromptTemplate.from_template(prompt_template)
+
+    if not "ultima_resposta" in st.session_state:
+        st.warning("Nenhuma resposta foi gerada ainda.", icon="⚠️")
+        st.stop()
+
+    ultima_resposta = st.session_state['ultima_resposta']
+
+    contexto_docs = ultima_resposta['source_documents']
+    contexto_list = [doc.page_content for doc in contexto_docs]
+    contexto_str = '\n\n'.join(contexto_list)
+
+    chain = st.session_state['chain']
+    memory = chain.memory
+    chat_history = memory.buffer_as_str
+
+    with st.container(border=True):
+        prompt = prompt_template.format(
+            chat_history=chat_history,
+            context=contexto_str,
+            question=''
+        )
+        st.code(prompt)
+
+
+debug_window()
@@ -0,0 +1,9 @@
+ipykernel==6.29.4
+langchain==0.1.16
+langchain-community==0.0.34
+langchain-openai==0.1.4
+openai==1.55.3
+pypdf==4.2.0
+streamlit==1.33.0
+python-dotenv==1.0.1
+faiss-cpu==1.8.0
@@ -0,0 +1,31 @@
+from PIL import Image
+import requests
+from io import BytesIO
+import os
+
+def load_avatar(image_source):
+    """
+    Carrega uma imagem de avatar a partir de um caminho local ou URL.
+
+    :param image_source: String contendo o caminho local ou URL da imagem
+    :return: Objeto PIL.Image ou None se a imagem não puder ser carregada
+    """
+    try:
+        if image_source.startswith(("http://", "https://")):
+            # Se for uma URL
+            response = requests.get(image_source)
+            img = Image.open(BytesIO(response.content))
+        else:
+            # Se for um caminho local
+            if os.path.exists(image_source):
+                img = Image.open(image_source)
+            else:
+                raise FileNotFoundError(
+                    f"Arquivo não encontrado: {image_source}")
+
+        # Redimensiona a imagem para um tamanho padrão (opcional)
+        img = img.resize((128, 128))
+        return img
+    except Exception as e:
+        print(f"Não foi possível carregar a imagem do avatar: {e}")
+        return None
@@ -0,0 +1,41 @@
+from utils.avatar_image import load_avatar
+import streamlit
+from time import sleep
+
+
+def get_chat_mensage(st: streamlit, mensagem, container, input_mensagem=None, chain=None, is_input=False):
+    """
+    Lida com a exibição de mensagens de chat em uma aplicação Streamlit.
+
+    Parâmetros:
+    st (streamlit): A instância do Streamlit.
+    mensagem: O objeto de mensagem contendo o tipo e o conteúdo da mensagem.
+    container: O container no qual as mensagens de chat serão exibidas.
+    input_mensagem (str, opcional): A mensagem de entrada do usuário. Padrão é None.
+    chain (opcional): O objeto chain usado para gerar respostas. Padrão é None.
+    is_input (bool, opcional): Flag indicando se a mensagem é uma mensagem de entrada. Padrão é False.
+
+    Retorna:
+    Nenhum
+    """
+    if is_input:
+        chat = container.chat_message(
+            "human", avatar=load_avatar("images/avatar_user.png"))
+        chat.markdown(mensagem)
+        chat = container.chat_message(
+            "ai", avatar=load_avatar("images/avatar_assistant.png"))
+        chat.markdown("Gerando Resposta...")
+        with st.spinner(""):
+            sleep(1)
+            resposta = chain.invoke({"question": input_mensagem})
+            st.session_state["ultima_resposta"] = resposta
+            st.rerun()
+    else:
+        if mensagem.type == "human":
+            chat = container.chat_message(
+                "human", avatar=load_avatar("images/avatar_user.png"))
+            chat.markdown(mensagem.content)
+        elif mensagem.type == "ai":
+            chat = container.chat_message(
+                "ai", avatar=load_avatar("images/avatar_assistant.png"))
+            chat.markdown(mensagem.content)
@@ -0,0 +1,46 @@
+import streamlit as st
+
+MODEL_NAME = "gpt-4o"
+RETRIEVAL_SEARCH_TYPE = "mmr"
+RETRIEVAL_KWARGS = {"k": 5, "fetch_k": 20}
+PROMPT = """
+Você é um chatbot que conversa sobre documentos PDF que lhe são fornecidos.
+No contexto fornecido, você deve ser capaz de responder a perguntas sobre o conteúdo dos documentos.
+Se você não souber a resposta, você pode dizer que não sabe e não tente inventar a resposta.
+
+Contexto:
+{context}
+
+Conversa atual:
+{chat_history}
+
+Human: {question}
+AI:"""
+
+MODEL_OPTIONS = ["gpt-4o", "gpt-4o-mini", "gpt-3.5-turbo", "o1-mini"]
+SEARCH_TYPES = ["mmr", "similarity", "similarity_score_threshold", "hybrid"]
+
+def get_config(config: str, st=st):
+    """
+    Recupera um valor de configuração do estado da sessão ou valores padrão.
+
+    Args:
+        config (str): O nome da configuração a ser recuperada.
+        st: O módulo streamlit, que contém o estado da sessão.
+
+    Retorna:
+        O valor da configuração solicitada se existir no estado da sessão,
+        caso contrário, retorna um valor padrão com base no nome da configuração.
+        Retorna None se o nome da configuração não for reconhecido.
+    """
+    if config.lower() in st.session_state:
+        return st.session_state[config.lower()]
+    if config.lower() == "model_name":
+        return MODEL_NAME
+    elif config.lower() == "retrieval_search_type":
+        return RETRIEVAL_SEARCH_TYPE
+    elif config.lower() == "retrieval_kwargs":
+        return RETRIEVAL_KWARGS
+    elif config.lower() == "prompt":
+        return PROMPT
+    return None