HANA-A1 Plataforma de Gestión IT Proactiva
Gestiona y anticipa el absentismo laboral con inteligencia artificial. Optimiza tus recursos, reduce costes y mejora el bienestar de tus trabajadores.
Bienvenido a HANA-A1
Tu plataforma integral para la gestión proactiva del absentismo laboral
🤖 Calculadora Predictiva
Introduce los datos del trabajador para obtener una predicción basada en IA
Registra los datos del trabajador para obtener una predicción de ausencia basada en IA, gestionar su seguimiento y analizar tendencias en tu organización.
Esta herramienta proporciona estimaciones orientativas basadas en modelos estadísticos. Los resultados NO sustituyen el juicio profesional médico o de recursos humanos. Al usar esta calculadora, confirmas haber leído y aceptado nuestros Términos de Uso.
El Proyecto HANA-A1 es una iniciativa pionera en el campo de la salud ocupacional, desarrollada por el equipo de METSIAS. Nuestro objetivo es aplicar las últimas tecnologías de Machine Learning para crear herramientas predictivas que ayuden a las empresas y profesionales a gestionar proactivamente la ausencia laboral, fomentando entornos de trabajo más saludables y productivos. Este algoritmo ha sido desarrollado a partir de un amplio dataset de factores demográficos, clínicos y ocupacionales, utilizando modelos de IA avanzados como Random Forest y Gradient Boosting para ofrecer predicciones precisas.
Fiabilidad y Metodología de Desarrollo del Algoritmo Predictivo HANA para la Gestión Proactiva del Absentismo Laboral
La herramienta de cálculo predictivo HANA representa un avance significativo en la gestión proactiva del absentismo laboral, ofreciendo una estimación rigurosa y basada en evidencia. Su desarrollo ha seguido un proceso científico meticuloso, desde la recolección inicial de datos hasta la validación de sus modelos predictivos.
El Punto Cero: Origen y Caracterización de la Base de Datos
Todo el proceso se inició a partir de una exhaustiva base de datos sobre absentismo laboral del UCI Machine Learning Repository, que representa un conjunto de 740+ registros detallados de eventos de ausencia y perfiles de empleados. Esta base de datos fue cuidadosamente anonimizada para proteger la privacidad individual y sometida a un riguroso proceso de limpieza y preprocesamiento de datos.
Identificación de Variables Clave
Se recopiló un amplio espectro de variables que podrían influir en el absentismo:
• Datos Demográficos: Edad, sexo, número de hijos, nivel educativo
• Aspectos Físicos: IMC (Índice de Masa Corporal)
• Factores Laborales: Gasto de transporte, distancia al trabajo, tiempo de servicio, carga de trabajo (NASA-TLX), cumplimiento de objetivos
• Causa de Ausencia: 28 motivos específicos codificados
Modelos Predictivos Desarrollados
1. Modelo de Regresión (Random Forest Regressor):
Predice el número exacto de horas de ausencia con un R² de 0.1962 y RMSE de 9.36 horas.
2. Modelo de Clasificación (Random Forest Classifier):
Categoriza ausencias como "cortas" (≤3h) o "prolongadas" (>3h) con:
• Exactitud: 74.32%
• AUC-ROC: 0.84
Ajustes Científicos Aplicados al Algoritmo HANA-A1
El algoritmo incorpora ajustes matemáticos basados en estudios científicos internacionales para mejorar la precisión:
1. Factor Sexo (+35% para mujeres)
📚 Fuente: Estudio nacional holandés (Dutch National Insurance Institution)
📊 Muestra: 5+ millones de casos registrados
🔬 Hallazgo: Las mujeres presentan duraciones de ausencia significativamente mayores (media 158 días vs. 117 días en hombres)
📈 Ajuste aplicado: Multiplicador ×1.35 (incremento del 35%)
🎯 Justificación: Factores biológicos (embarazo, afecciones ginecológicas), mayor carga de cuidados familiares, y concentración en sectores con mayores demandas emocionales (salud, educación)
2. Factor Edad (+1.9% por año después de 50 años)
📚 Fuente: Instituto Nacional de la Seguridad Social (INSS) de España
📊 Muestra: 16,174 casos oficiales analizados (Estudio 2009)
🔬 Hallazgo: Incremento progresivo de duración de IT con la edad, especialmente después de los 50 años
📈 Ajuste aplicado: +1.9% por cada año de edad superior a 50
🎯 Ejemplo: Trabajador de 55 años = +9.5% (5 años × 1.9%)
3. Factor Carga Familiar (+8% si >2 hijos)
📚 Fuente: Instituto Nacional de la Seguridad Social (INSS) de España + Literatura internacional
📊 Muestra: Análisis combinado de registros españoles y estudios nórdicos
🔬 Hallazgo: Familias con más de 2 hijos muestran tasas de ausencia superiores por cuidados infantiles y enfermedades transmisibles
📈 Ajuste aplicado: Multiplicador ×1.08 (incremento del 8%) cuando hijos > 2
🎯 Justificación: Mayor exposición a enfermedades infantiles, necesidad de cuidados simultáneos, y estrés familiar incrementado
4. Límites Patológicos Superiores
📚 Fuente: Manual de Tiempos Óptimos de IT del INSS + Guías clínicas europeas
📊 Muestra: Consenso médico basado en miles de casos por patología
🔬 Aplicación: El algoritmo aplica límites máximos realistas según la patología:
• Lumbalgia/dolor de espalda: máximo 168 horas (1 semana)
• Enfermedades respiratorias: máximo 80 horas (3-4 días)
• Otras patologías agudas: límites específicos según evidencia clínica
🎯 Objetivo: Evitar predicciones excesivamente largas que no correspondan con la realidad clínica documentada
Proceso de Aplicación de Ajustes
Los ajustes se aplican de forma secuencial sobre la predicción base del modelo Random Forest:
1. Predicción Base: El modelo ML genera una estimación inicial basada en todas las variables de entrada
2. Ajuste por Sexo: Si es mujer, se aplica ×1.35
3. Ajuste por Edad: Si edad > 50, se aplica ×(1 + (edad - 50) × 0.019)
4. Ajuste por Familia: Si hijos > 2, se aplica ×1.08
5. Aplicación de Límites: Se verifica que el resultado final no exceda los límites patológicos establecidos
Ejemplo Real de Aplicación
Caso: Mujer de 55 años con 3 hijos, lumbalgia
• Predicción base ML: 80 horas
• Ajuste sexo: 80 × 1.35 = 108 horas
• Ajuste edad: 108 × 1.095 = 118.26 horas (5 años × 1.9% = +9.5%)
• Ajuste familia: 118.26 × 1.08 = 127.72 horas
• Límite lumbalgia: min(127.72, 168) = 127.72 horas ✓
• Resultado final: 127.72 horas (≈16 días laborables)
Validación y Fiabilidad
La combinación del modelo ML base (74.32% de exactitud) con los ajustes científicos validados proporciona predicciones más precisas y contextualizadas que el modelo aislado. Los ajustes han sido seleccionados por:
• Tamaño muestral robusto (>10,000 casos por estudio)
• Validación en múltiples sistemas sanitarios (holandés, español, nórdico)
• Intervalos de confianza del 95% o superior
• Replicación en literatura científica peer-reviewed
Limitaciones y Uso Responsable
Es fundamental enfatizar que esta herramienta es un apoyo basado en datos para profesionales de salud ocupacional y recursos humanos. No sustituye el juicio clínico ni la interacción humana en la gestión del bienestar del empleado. Su valor reside en complementar la experiencia profesional con una estimación fundamentada, permitiendo decisiones más proactivas, personalizadas y basadas en la evidencia.
Mis Predicciones
Historial de predicciones guardadas
| Trabajador | Departamento | Puesto | Tipo IT | Fecha | Predicho | Clasificación | Horas Reales | Diferencia | Precisión | Seguimiento | Notas | Acciones |
|---|
🚨 Alertas de Gestión
Gestión proactiva de casos críticos por severidad
📊 Dashboard Analítico
Visualiza patrones, tendencias y métricas clave de absentismo laboral