********************************************* * CHATBOT PERSONALIZABLE * * Con conocimiento y personalidad * ********************************************* Descripción: ------------ Chatbot en español con capacidades avanzadas: - Búsqueda semántica en bases de conocimiento personalizadas - Personalidad configurable (formalidad, humor, creatividad) - Carga de conocimiento en formatos CSV, XLSX y PDF - Interfaz web interactiva mediante Gradio - Modelos especializados en español (BERT) Requisitos: ----------- - Python 3.8 o superior - CUDA (opcional para GPU) - Archivos de conocimiento en formatos soportados Instalación: ------------ 1. Clona el repositorio: git clone https://github.com/tu-usuario/chatbot-personalizable.git cd chatbot-personalizable 2. Instala dependencias: pip install -r requirements.txt 3. (Opcional) Configura entorno virtual: python -m venv venv source venv/bin/activate (Linux/Mac) venv\Scripts\activate (Windows) Ejecución: --------- 1. Inicia el servidor: python app.py 2. Accede a la interfaz en: http://localhost:7860 Características Principales: ---------------------------- 1. Carga de conocimiento: - Soporta CSV, XLSX y PDF - Procesamiento automático de texto - Creación de embeddings para búsqueda semántica 2. Personalización: - Modo formal/informal - Nivel de humor (0.0 a 1.0) - Creatividad/temperatura (0.0 a 1.0) - Uso de emojis 3. Interfaz: - Pestaña para cargar conocimiento - Panel de configuración de personalidad - Chat en tiempo real con historial Formato de conocimiento: ------------------------ - CSV/XLSX: Debe contener columna "contenido" - PDF: Extrae texto automáticamente - Ejemplo CSV válido: contenido "La capital de Francia es París" "El símbolo químico del agua es H2O" Despliegue en Hugging Face: -------------------------- 1. Crea un nuevo espacio (Space) en Hugging Face 2. Selecciona "Gradio" como framework 3. Sube todos los archivos del proyecto 4. Configura requirements.txt 5. Publica y comparte tu bot Limitaciones: ------------ - PDF complejos (tablas/gráficos) pueden no procesarse bien - Contexto máximo de 512 tokens (limitación de BERT) - Sin memoria entre conversaciones Mejoras futuras: ---------------- - Implementar memoria de conversación - Soporte para imágenes en PDF - Integración con APIs externos - Temas personalizados para la interfaz Créditos: --------- - Modelos de lenguaje: Hugging Face - Framework: Gradio - Búsqueda semántica: Sentence Transformers