Spaces:

gerardocabrera
/

clasificacion-automatica-tickets

Sleeping

App Files Files Community

gerardocabrera commited on 8 days ago

Commit

cdcc94d

1 Parent(s): 5edad88

Se modifica la función procesar_tickets para un mejor procesamiento

Browse files

Files changed (1) hide show

app.py +77 -44

app.py CHANGED Viewed

@@ -9,6 +9,7 @@ import torch
 import logging
 from dotenv import load_dotenv
 from transformers import pipeline, AutoTokenizer
 # Configurar logging
 logging.basicConfig(level=logging.INFO)
@@ -35,6 +36,12 @@ URGENCY_PATTERNS = [  # Patrones
 # 2. Clase para manejo de tickets
 class TicketSystem:
     def __init__(self):
         self.mode = os.getenv("TICKET_API_MODE", "simulated")
         self.tickets = []
@@ -203,52 +210,58 @@ def clasificar_texto(text: str) -> str:
         return clasificar_con_palabras_clave(text)
 # 5. Función para procesar archivos CSV
-def procesar_tickets(input_csv, output_csv):
-    """Procesa un archivo CSV con tickets y genera resultados clasificados"""
     try:
         df = pd.read_csv(input_csv)
-        # Verificar columna requerida
-        if 'descripcion' not in df.columns:
-            raise ValueError("El CSV debe contener una columna 'descripcion'")
-        # Clasificar cada ticket
         categorias_pred = []
         urgencias = []
         logger.info("Iniciando procesamiento de tickets...")
-        for i, descripcion in enumerate(df['descripcion']):
-            # Clasificar categoría
             descripcion_str = str(descripcion)
             categoria = clasificar_texto(descripcion_str)
             categorias_pred.append(categoria)
-            # Detectar urgencia
             urgencia = es_urgente(descripcion_str)
             urgencias.append(urgencia)
             logger.info(f"Ticket {i+1}: '{descripcion_str[:30]}...' -> Categoría: {categoria}, Urgente: {urgencia}")
         df['categoria'] = categorias_pred
         df['urgente'] = urgencias
-        # Guardar resultados
         df.to_csv(output_csv, index=False)
         logger.info(f"Resultados guardados en {output_csv}")
-        # Separar tickets urgentes
         urgentes = df[df['urgente']]
         if not urgentes.empty:
-            urgentes_csv = "tickets_urgentes.csv"
             urgentes.to_csv(urgentes_csv, index=False)
             logger.info(f"⚠️ {len(urgentes)} tickets urgentes guardados en '{urgentes_csv}'")
-            return df, urgentes_csv
         else:
             logger.info("No se encontraron tickets urgentes")
-            return df, None
     except Exception as e:
         logger.error(f"❌ Error procesando CSV: {e}")
 # 6. Inicializar sistema de tickets para la interfaz web
@@ -345,42 +358,44 @@ with gr.Blocks(title="Sistema de Soporte Inteligente", theme=gr.themes.Soft()) a
         outputs=ticket_db
     )
     """
     # Función wrapper para procesar CSV
     def procesar_csv_wrapper(archivo):
         if archivo is None:
             return "❌ No se subió ningún archivo", None, None, gr.update(visible=False)
         try:
-            # Obtener ruta temporal del archivo subido
             file_path = archivo.name
-            # Procesar archivo
-            output_file = "tickets_clasificados.csv"
-            result, urgentes_file = procesar_tickets(file_path, output_file)
             if result is not None:
-                # Si hay tickets urgentes, mostrar el enlace
                 if urgentes_file:
                     return (
-                        "✅ Procesamiento completado con éxito",
                         output_file,
                         urgentes_file,
                         gr.update(visible=True)
                     )
                 else:
                     return (
-                        "✅ Procesamiento completado (sin tickets urgentes)",
                         output_file,
                         None,
                         gr.update(visible=False)
                     )
             else:
                 return "❌ Error procesando el archivo", None, None, gr.update(visible=False)
         except Exception as e:
             return f"❌ Error: {str(e)}", None, None, gr.update(visible=False)
     process_btn.click(
         fn=procesar_csv_wrapper,
         inputs=file_input,
@@ -389,11 +404,29 @@ with gr.Blocks(title="Sistema de Soporte Inteligente", theme=gr.themes.Soft()) a
 # 9. Ejecutar la aplicación
 if __name__ == "__main__":
-    # Para prueba directa desde terminal:
-    # result, urgentes = procesar_tickets("tickets.csv", "resultados.csv")
-    demo.launch(
-        server_name="0.0.0.0",
-        server_port=7860,
-        show_error=True
-    )

 import logging
 from dotenv import load_dotenv
 from transformers import pipeline, AutoTokenizer
+import sys
 # Configurar logging
 logging.basicConfig(level=logging.INFO)
 # 2. Clase para manejo de tickets
 class TicketSystem:
+    def limpiar_historial(self, filename="tickets_db.json"):
+        """Limpia el historial de tickets simulados."""
+        self.tickets = []
+        self.next_id = 1000
+        self.save_to_json(filename)
+        return True
     def __init__(self):
         self.mode = os.getenv("TICKET_API_MODE", "simulated")
         self.tickets = []
         return clasificar_con_palabras_clave(text)
 # 5. Función para procesar archivos CSV
+def procesar_tickets(input_csv, output_csv=None):
+    """
+    Procesa un archivo CSV con tickets y genera resultados clasificados.
+    - Permite nombres únicos para archivos de salida.
+    - Valida la existencia de la columna 'descripcion' (case-insensitive).
+    """
     try:
         df = pd.read_csv(input_csv)
+        # Buscar columna 'descripcion' de forma flexible
+        desc_col = None
+        for col in df.columns:
+            if col.strip().lower() == 'descripcion':
+                desc_col = col
+                break
+        if not desc_col:
+            raise ValueError("El CSV debe contener una columna llamada 'descripcion' (no se encontró, revise el encabezado)")
+        # Validar duplicados
+        num_duplicados = df.duplicated(subset=[desc_col]).sum()
+        if num_duplicados > 0:
+            logger.warning(f"Se encontraron {num_duplicados} tickets duplicados (por descripción) en el archivo CSV.")
+        # Nombres únicos para archivos de salida
+        timestamp = time.strftime("%Y%m%d_%H%M%S")
+        if not output_csv:
+            output_csv = f"tickets_clasificados_{timestamp}.csv"
+        urgentes_csv = f"tickets_urgentes_{timestamp}.csv"
         categorias_pred = []
         urgencias = []
         logger.info("Iniciando procesamiento de tickets...")
+        for i, descripcion in enumerate(df[desc_col]):
             descripcion_str = str(descripcion)
             categoria = clasificar_texto(descripcion_str)
             categorias_pred.append(categoria)
             urgencia = es_urgente(descripcion_str)
             urgencias.append(urgencia)
             logger.info(f"Ticket {i+1}: '{descripcion_str[:30]}...' -> Categoría: {categoria}, Urgente: {urgencia}")
         df['categoria'] = categorias_pred
         df['urgente'] = urgencias
         df.to_csv(output_csv, index=False)
         logger.info(f"Resultados guardados en {output_csv}")
         urgentes = df[df['urgente']]
         if not urgentes.empty:
             urgentes.to_csv(urgentes_csv, index=False)
             logger.info(f"⚠️ {len(urgentes)} tickets urgentes guardados en '{urgentes_csv}'")
+            return df, urgentes_csv, output_csv, len(df), len(urgentes), num_duplicados
         else:
             logger.info("No se encontraron tickets urgentes")
+            return df, None, output_csv, len(df), 0, num_duplicados
     except Exception as e:
         logger.error(f"❌ Error procesando CSV: {e}")
+        raise
 # 6. Inicializar sistema de tickets para la interfaz web
         outputs=ticket_db
     )
     """
     # Función wrapper para procesar CSV
     def procesar_csv_wrapper(archivo):
+        """
+        Procesa el archivo CSV subido y retorna mensajes y archivos de salida únicos.
+        """
         if archivo is None:
             return "❌ No se subió ningún archivo", None, None, gr.update(visible=False)
         try:
             file_path = archivo.name
+            result, urgentes_file, output_file, total, urgentes_count, duplicados = procesar_tickets(file_path)
+            resumen = f"Total tickets procesados: {total}. "
+            if duplicados > 0:
+                resumen += f"Duplicados detectados: {duplicados}. "
+            if urgentes_count > 0:
+                resumen += f"Tickets urgentes: {urgentes_count}. "
+            else:
+                resumen += "No se encontraron tickets urgentes. "
             if result is not None:
                 if urgentes_file:
                     return (
+                        f"✅ Procesamiento completado con éxito. {resumen}Resultados: {output_file}",
                         output_file,
                         urgentes_file,
                         gr.update(visible=True)
                     )
                 else:
                     return (
+                        f"✅ Procesamiento completado. {resumen}Resultados: {output_file}",
                         output_file,
                         None,
                         gr.update(visible=False)
                     )
             else:
                 return "❌ Error procesando el archivo", None, None, gr.update(visible=False)
         except Exception as e:
             return f"❌ Error: {str(e)}", None, None, gr.update(visible=False)
     process_btn.click(
         fn=procesar_csv_wrapper,
         inputs=file_input,
 # 9. Ejecutar la aplicación
 if __name__ == "__main__":
+    # Si se pasa un archivo CSV como argumento, procesar en modo batch
+    if len(sys.argv) > 1:
+        input_csv = sys.argv[1]
+        logger.info(f"Procesando archivo: {input_csv}")
+        try:
+            result, urgentes, salida, total, urgentes_count, duplicados = procesar_tickets(input_csv)
+            logger.info(f"Total tickets procesados: {total}")
+            logger.info(f"Duplicados detectados: {duplicados}")
+            logger.info(f"Tickets urgentes: {urgentes_count}")
+            logger.info(f"Archivo de resultados: {salida}")
+            if urgentes:
+                logger.info(f"Archivo de tickets urgentes: {urgentes}")
+            else:
+                logger.info("No se encontraron tickets urgentes.")
+        except Exception as e:
+            logger.error(f"Error procesando el archivo: {e}")
+            sys.exit(1)
+    else:
+        # Modo interfaz web
+        demo.launch(
+            server_name="0.0.0.0",
+            server_port=7860,
+            show_error=True
+        )