*********************************************
*            CHATBOT PERSONALIZABLE          *
*       Con conocimiento y personalidad      *
*********************************************

Descripción:
------------
Chatbot en español con capacidades avanzadas:
- Búsqueda semántica en bases de conocimiento personalizadas
- Personalidad configurable (formalidad, humor, creatividad)
- Carga de conocimiento en formatos CSV, XLSX y PDF
- Interfaz web interactiva mediante Gradio
- Modelos especializados en español (BERT)

Requisitos:
-----------
- Python 3.8 o superior
- CUDA (opcional para GPU)
- Archivos de conocimiento en formatos soportados

Instalación:
------------
1. Clona el repositorio:
   git clone https://github.com/tu-usuario/chatbot-personalizable.git 
   cd chatbot-personalizable

2. Instala dependencias:
   pip install -r requirements.txt

3. (Opcional) Configura entorno virtual:
   python -m venv venv
   source venv/bin/activate  (Linux/Mac)
   venv\Scripts\activate     (Windows)

Ejecución:
---------
1. Inicia el servidor:
   python app.py

2. Accede a la interfaz en:
   http://localhost:7860

Características Principales:
----------------------------
1. Carga de conocimiento:
   - Soporta CSV, XLSX y PDF
   - Procesamiento automático de texto
   - Creación de embeddings para búsqueda semántica

2. Personalización:
   - Modo formal/informal
   - Nivel de humor (0.0 a 1.0)
   - Creatividad/temperatura (0.0 a 1.0)
   - Uso de emojis

3. Interfaz:
   - Pestaña para cargar conocimiento
   - Panel de configuración de personalidad
   - Chat en tiempo real con historial

Formato de conocimiento:
------------------------
- CSV/XLSX: Debe contener columna "contenido"
- PDF: Extrae texto automáticamente
- Ejemplo CSV válido:
  contenido
  "La capital de Francia es París"
  "El símbolo químico del agua es H2O"

Despliegue en Hugging Face:
--------------------------
1. Crea un nuevo espacio (Space) en Hugging Face
2. Selecciona "Gradio" como framework
3. Sube todos los archivos del proyecto
4. Configura requirements.txt
5. Publica y comparte tu bot

Limitaciones:
------------
- PDF complejos (tablas/gráficos) pueden no procesarse bien
- Contexto máximo de 512 tokens (limitación de BERT)
- Sin memoria entre conversaciones

Mejoras futuras:
----------------
- Implementar memoria de conversación
- Soporte para imágenes en PDF
- Integración con APIs externos
- Temas personalizados para la interfaz

Créditos:
---------
- Modelos de lenguaje: Hugging Face
- Framework: Gradio
- Búsqueda semántica: Sentence Transformers