El aumento de la supervivencia, en las unidades de paciente crítico (UPC) es una de los factores asociados al incremento de la debilidad adquirida en UCI (DAUCI). Este cuadro clínico se define como un síndrome de debilidad generalizada de las extremidades, para el cual no existe una explicación alternativa que no sea la propia enfermedad crítica del paciente2. Los principales factores de riesgo para el desarrollo de la DAUCI son el reposo prolongado en cama, la hiperglicemia, la sepsis, el uso de corticoesteroides y bloqueadores neuromusculares1,3-12. Fisiopatológicamente, estos factores se asocian con un desbalance entre la síntesis y degradación de proteínas musculares, asociado a necrosis de las miofibrillas, produciéndose una disminución rápida y significativa de la masa muscular que puede llegar a 15% los primeros 7 días de la enfermedad crítica, además de una disminución de la densidad mineral ósea13,14.
Entre los métodos diagnósticos utilizados para el establecimiento de la DAUCI se encuentra la electromiografía y la biopsia muscular, sin embargo, su alto costo y carácter invasivo han promovido el desarrollo de métodos diagnósticos simplificados como el Medical Research Council Sum Score (MRC-SS) cuyo puntaje se obtiene a partir de la cuantificación de la fuerza ejercida contra la resistencia manual aplicada por el evaluador, lo cual requiere la participación activa del paciente, por lo tanto debe ser aplicada posterior a la suspensión de la sedación15,16. Esto retarda significativamente el proceso diagnóstico dificultando el reconocimiento precoz de este síndrome durante la etapa de sedación del paciente. Es así como se han registrado tasas de incidencia variables que oscilan entre 25 y 75%1,17,18.
Entre las principales consecuencias de la DAUCI se encuentran el retardo en el destete de ventilación mecánica (VM) y aumento, tanto del tiempo de estadía en UPC, como de la morbimortalidad hospitalaria y de los costos19,20. Adicionalmente, la DAUCI se ha asociado al desacondicionamiento cardiorrespiratorio y muscular2,4,21,22, afectando significativamente el desempeño funcional y calidad de vida de los pacientes; lo cual ha sido evidenciado hasta 5 años después del alta hospitalaria5,6,22-27. Por este motivo, el desarrollo de instrumentos que permitan cuantificar de forma certera la magnitud del deterioro funcional en este tipo de pacientes es crucial para el desarrollo de estrategias terapéuticas apropiadas, dirigidas a atenuar el deterioro funcional asociado a la enfermedad crítica.
La evaluación de la funcionalidad considera diversos aspectos, tales como la comprensión de la tarea por parte del paciente, coordinación, procesamiento de la información visual, control motor central y activación de las vías motoras eferentes; todo esto además puede verse influenciado por el ambiente. Por lo tanto, es necesario el desarrollo de instrumentos que permitan determinar este constructo desde todas sus dimensiones. Es así como en los últimos años han surgido diversas escalas de evaluación funcional para pacientes críticos28,29,30-32, las cuales han mostrado validez y confiabilidad variables en los diferentes estudios clínicos. Por este motivo el presente estudio tiene por objetivo determinar la validez de criterio y confiabilidad de las escalas de funcionalidad para pacientes adultos críticamente enfermos.
Material y Métodos
Criterios de elegibilidad de los artículos primarios
Se consideraron estudios en inglés y español dirigidos a determinar las propiedades psicométricas de las escalas de evaluación funcional para paciente crítico. Los estudios debían describir la asociación entre el puntaje de la escala de evaluación funcional y el resultado de un estándar de referencia relacionado con la capacidad funcional del paciente. Como estándar de referencia se consideró criterios frecuentemente utilizados en este tipo de estudios. Así para la validez de criterio concurrente se utilizó el resultado del Test de Marcha de 6 min (TM6), Timed Up and Go (TUG), Medical Research Council Sum Score (MRC-SS) y la fuerza de prensión. Por su parte, para la validez de criterio predictivo se consideraron destino al alta (domicilio o centro de cuidado agudo a largo plazo (CALP) y necesidad de rehabilitación al alta como criterios de referencia.
Como medida de asociación para la evaluación de la validez de criterio concurrente se consideró el coeficiente r de Pearson o Rho de Spearman, para la validez de criterio predictivo se consideró la razón de probabilidades (OR) y el área bajo la curva ROC (AUC). Por su parte, como medida de asociación para la confiabilidad inter e intraobservador se consideró al coeficiente Kappa (k) para variables cualitativas y el coeficiente de correlación intraclase (CCI) para las variables cuantitativas.
Sujetos de estudio
Los estudios primarios debía incorporar pacientes críticamente enfermos, quienes son definidos como un enfermo cuya condición patológica afecta a uno o más sistemas poniendo en riesgo actual o potencial su vida y presenta condiciones de reversibilidad que hacen necesaria la aplicación impostergable de técnicas de monitorización, vigilancia, manejo y soporte vital avanzado33. Se consideraron estudios realizados en sujetos adultos de ambos géneros, críticamente enfermos, hospitalizados en una UPC médica o quirúrgica. Se excluyeron estudios realizados en pacientes con enfermedad neurológica, neuromuscular y/o traumatológica, así como también en individuos menores de 18 años sin análisis por subgrupo.
Metodología de evaluación de la funcionalidad
Los estudios debían evaluar la funcionalidad mediante una escala de evaluación aplicada por un profesional con experiencia en el manejo de pacientes hospitalizados en una UPC. Al momento de la evaluación los sujetos de estudio debían encontrarse vigiles y cooperadores, en condiciones de estabilidad respiratoria y hemodinámica, y sin contraindicaciones para movilizarse en cama34.
Búsqueda de artículos
La búsqueda se realizó entre septiembre y noviembre de 2016 en las bases de datos Medline, Scientific Electronic Library Online (SciELO), Physiotherapy Evidence Database (PEDro), Academic Search Complete, Rehabilitation & Sports Medicine Source y ProQuest. Fueron considerados artículos publicados entre enero de 2000 hasta noviembre de 2016.
Se utilizaron los siguientes términos descriptores médicos (Medical Subject Headings [MeSH]): Intensive Care Units, Critical Illness, Critical Care Outcomes, Patient Outcome Assessment, Outcome and Process Assessment, Validation Studies, Validity, Functional, Mobility Limitation, Physical Therapy Modalities, Physical Fitness, Physical Exertion, Physical Endurance, Motor Activity; y los operadores boleanos AND y OR.
Identificación de los artículos
Se revisaron los títulos y los resúmenes de los artículos atingentes. Luego se obtuvieron los textos extensos de aquellos resúmenes que cumplieron con los criterios de elegibilidad. Los datos fueron extraídos por 2 investigadoras (ML, PS) de manera independiente y fueron registrados en una planilla ad hoc. Se registró nombre de la escala, autor, año de publicación, tamaño de muestra, edad, género, validez de criterio y confiabilidad inter e intraobservador.
Evaluación de calidad metodológica
La calidad metodológica (CM) fue evaluada por dos revisoras (ML, PS) a través de la lista COSMIN35-37. En este caso se consideraron los cuadros de la lista que evalúan validez de criterio y confiabilidad. Las discrepancias en las puntuaciones obtenidas entre las revisoras fueron resueltas por consenso.
Resultados
Selección de los estudios
La búsqueda arrojó 8.526 artículos. La Figura 1 presenta el diagrama de flujo que describe la secuencia de búsqueda y razones de exclusión de artículos. Un total de 4 artículos fueron finalmente considerados para la revisión.
Características de los estudios primarios
Todos los artículos seleccionados fueron escritos en inglés y publicados entre los años 2013 y 2016. El tamaño muestral de los estudios varió entre 20 y 116 participantes, en total fueron 302 participantes, de los cuales 48,2% eran hombres y 51,8% mujeres. Un estudio no reportó el tamaño muestral según sexo38,39. En 2 estudios se describió la edad de la muestra, cuyos promedios fueron entre 51,0 y 64,5 años40-43 (Tabla 1). De las patologías de ingreso a UPC, especificadas, las principales fueron quirúrgicas (46,0%), seguidas por enfermedades respiratorias (17,5%) (Tabla 2).
Autor (ref) | Año | Escala | Genero n (M/F) | Edad Promedio ± DS | Validez de criterio | Confiabilidad según observador | |||
---|---|---|---|---|---|---|---|---|---|
Concurrente | Predictiva | Interobservador | Intraobservador | ||||||
1. Denehey L. (44) | 2013 | PFIT-s | 116 (46/70) | TM6 | r = 0,41, 95% IC = 0,24 a 0,55, p < 0,001 | ||||
TUG | r = -0,60, 95% IC = -0,70 a -0,46, p < 0,001 | ||||||||
MRC-ss | rho = 0,49, 95% IC = 0,33 a 0,62, p < 0,001, n = 105 | ||||||||
Dism de nec. de Rhb | OR = 0,86, p = 0,02 | ||||||||
destino al alta (domicilio) | OR = 1,20, p = 0,0 | ||||||||
2. Nawa R. (41) | 2014 | Perme | 20 (12/8) | 64.5 (20-86)* | CCI = 0,98, 95% IC 0,97 a 0,99 | ||||
3. Sommers J. (38) | 2016 | DEMMI | 115 (NE) | MRC-ss | rho = 0,57, 95% IC = 0,44 a 0,69 | CCI = 0,93, 95% IC = 0,91 a 0,95 | CCI 0,68, 95% IC = 0,46 a 0,82 | ||
4. Nordon- craft A. (42) | 2014 | PFIT-s | 51 (32/19) | 51 ± 16.3 | MRC-ss | rho = 0,923, p < 0,0005 | |||
Fuerza prensión | rho = 0,763, p < 0,0005 | ||||||||
Destino al alta (CALP) | PFIT-s basal: OR = 0,63, 95% CI = 0,40 a 0,99, p = 0,043 | ||||||||
PFIT-s alta: OR = 0,70, 95% CI = 0,51 a 0,98, p = 0,038 |
DS: desviación estándar; TM6: test de marcha de seis minutos; TUG: Timed Up and Go; MRC-ss: Medical Research Council Sum Score; CALP: centro de cuidado agudo a largo plazo; r: coeficiente r de Pearson; rho: coeficiente rho de Spearman; OR: odds ratio; CI: intervalo de confianza; CCI: coeficiente de correlación intraclase; NE: no especificado;
*resultado expresado en mediana y rango intercuartílico.
Calidad metodológica
Dos de los 3 artículos que evaluaban validez de criterio presentaron una CM caracterizada como “razonable”. El tercero, así como los 2 que evaluaron confiabilidad, presentaron una CM categorizada como “pobre”.
Escalas identificadas
Las escalas identificadas fueron: Physical Function ICU Test-scored (PFIT-s)42,44, Perme ICU Mobility Score (Perme MS)41, y De Morton Mobility Index (DEMMI)38.
Validez de criterio
En los estudios donde se evaluó la validez concurrente, se consideró al MRC-SS38,42-44 como estándar de referencia. Adicionalmente, en 1 estudio se consideró la fuerza de prensión42,43 y en otro las pruebas TUG y TM6 como estándar de referencia44. Por otro lado, en 2 estudios se evaluó la validez predictiva considerando el destino al alta (1 al domicilio44 y 1 a un CALP42), y en 1 estudio considerando la disminución de necesidad de rehabilitación al alta hospitalaria como estándar de referencia44.
En relación a la validez concurrente de las escalas, la escala PFIT-s presentó correlación positiva con el TM6 (r = 0,41)44, con MRC-SS (rho = entre 0,49 y 0,92)42,44 y con la fuerza de prensión (rho = 0,76)45; así como correlación negativa con TUG (r = -0,60)44. La escala DEMMI presentó una correlación positiva con MRC-SS38.
En relación a la validez predictiva, se observó que el puntaje de la escala PFIT-s predijo la necesidad de rehabilitación al alta (OR = 0,86)44 y la probabilidad de egreso al domicilio (OR = 1,20)44 (Tabla 1).
Confiabilidad
En 2 estudios fue evaluada la confiabilidad interobservador38,41, y en uno la confiabilidad intraobservador38. Todos los estudios poseen un alto nivel de confiabilidad intraobservador, reportando un CCI entre 0,93 para la escala DEMMI38 y 0,98 para la escala Perme41. Por su parte, el CCI para la confiabilidad intraobservador de la escala DEMMI fue de 0,6838.
En la Tabla 1 se muestran las propiedades de medición de cada una de las escalas identificadas.
Discusión
Este estudio fue realizado con el fin de determinar la validez de criterio y la confiabilidad inter e intraobservador de las escalas que evalúan funcionalidad en pacientes adultos críticamente enfermos. Las escalas identificadas fueron: PFIT-s, Perme MS y DEMMI. Así, los principales hallazgos de este estudio fueron que las escalas muestran diversos niveles de asociación (0,41 a 0,92) con los estándares de referencia considerados, lo cual no permite descartar la posible influencia de variables intervinientes inadecuadamente controladas en los estudios.
La Clasificación Internacional del Funcionamiento (CIF), considera a la fuerza y masa muscular, la movilidad funcional y los factores ambientales44,45 como factores que determinan la funcionalidad. En este contexto, todas las escalas encontradas incorporan alguno de los factores determinantes de la CIF, siendo Perme MS, la que considera más elementos en su estructura metodológica.
En una revisión sistemática (RS) recientemente publicada por Parry y cols.29 se estableció que los mejores instrumentos para evaluar fuerza, masa muscular y funcionalidad en UPC en base a sus propiedades de medición son: MRC-SS, Ultrasonografía, PFIT-s y CPAx, respectivamente. El único de estos instrumentos identificado en nuestro estudio fue la escala PFIT-s42,44, mostrando una validez de criterio de moderada a fuerte. Vale la pena destacar que en nuestra RS, a diferencia de otras revisiones no fueron consideradas escalas de evaluación de las actividades de la vida diaria como el índice de Barthel y el de Katz28-32, las cuales incluyen en sus dominios actividades que no pueden ser realizadas en las UPC como subir y bajar escaleras, vestirse, etc30,31. Tampoco fueron incluidos estudios realizados en pacientes con patología neurológica, neuromuscular y/o traumatológica28,29, debido a que esas patologías promueven el deterioro funcional del paciente por sí mismas.
La heterogeneidad de la muestra de estudio pudiese ser un factor determinante en la variabilidad de los índices de validez calculados en los estudios primarios. En este sentido algunos estudios sugieren que el grado de severidad de la muestra pudiese ser un factor determinante en la magnitud de la asociación observada entre la escala y el estándar de referencia42.
Por otra parte, los dos estudios que analizaron la reproducibilidad de las escalas mostraron un nivel de confiabilidad moderado a alto38,41. Sin embargo, no se puede descartar que el nivel de experiencia de los evaluadores pueda afectar la confiabilidad del instrumento.
El presente estudio posee ciertas debilidades que deben ser discutidas. Así, sólo 4 estudios cumplieron con los criterios de elegibilidad. Adicionalmente, 2 de los 4 artículos encontrados presentaron una calidad metodológica categorizada como pobre y los otros 2 una calidad metodológica categorizada como razonable, por lo tanto, no es posible descartar totalmente la existencia de sesgo, pudiendo afectar a la veracidad de los resultados.
Finalmente es posible concluir que las escalas muestran una moderada validez y confiabilidad, sin embargo, debido a la variabilidad de la magnitud de asociación observada, no es posible establecer con certeza el instrumento con mejores propiedades de medición. Por este motivo, futuros estudios son necesarios para establecer los dominios que permitan determinar con mayor certeza el nivel de funcionalidad en este grupo de pacientes.