La Escuela de Salud Pública de la ۶Ƶ recibió al epidemiólogo y genetista Andree Valle Campos, investigador del programa Epiverse-TRACE de la London School of Hygiene & Tropical Medicine (LSHTM), quien participó como expositor principal en el seminario “Buenas prácticas para un análisis reproducible, abierto y sostenible para el análisis de datos de epidemias”, y dictó el taller intensivo “Reproducibilidad, apertura y sostenibilidad del análisis de datos en salud pública”, realizado los días 22 y 24 de abril.
Ambas actividades fueron organizadas por el Grupo de Ciencia de Datos para la Salud Pública (CDSP) y forman parte del proyecto “Reproducibilidad, apertura y sostenibilidad del análisis de datos en salud pública”, una de las cinco iniciativas adjudicadas por académicos y estudiantes de la Escuela de Salud Pública en el Concurso “Dispositivos para la promoción del quehacer interdisciplinario y transdisciplinario” (ID: DSI01/24), financiado por la Vicerrectoría de Investigación y Desarrollo (VID) de la ۶Ƶ.
El seminario, desarrollado el 23 de abril, fue una instancia de reflexión sobre el rol de la ciencia abierta y la reproducibilidad en la investigación aplicada a salud pública, mientras que el taller —de carácter práctico y formativo— profundizó en el uso de herramientas específicas del entorno R para mejorar la sostenibilidad de los flujos de trabajo en análisis de datos. Ambas instancias estuvieron dirigidas a estudiantes, profesionales y académic@s que trabajan con datos en salud pública o áreas afines, con conocimientos previos en R y RStudio.
Durante su visita, Andree Valle compartió su experiencia y visión sobre los beneficios de integrar enfoques reproducibles en la investigación científica.
P: Desde su experiencia en centros internacionales como el London School of Hygiene & Tropical Medicine, ¿qué aprendizajes considera más relevantes para fortalecer las capacidades de análisis de datos en salud pública en Chile?
R: “Un equipo que analiza datos se ve fortalecido en sus capacidades al poder compartir, extender y actualizar sus análisis con herramientas desarrolladas por otros equipos. En este sentido, la incorporación progresiva de lenguajes de programación abiertos como R permite estas cualidades”, señaló Valle.
“Al compartir nuestros análisis en código abierto, facilitamos la revisión por pares, posibilitamos su estandarización y reusabilidad en 'paquetes'. Así mismo, podemos extender nuestros análisis y construir sobre los esfuerzos de otros grupos que complementan nuestra área de experiencia, y vice versa”, agregó.
P: ¿Cuáles considera que son los principales desafíos que enfrentan actualmente los investigadores y profesionales de la salud pública en América Latina respecto a la reproducibilidad y apertura de sus análisis de datos?
R: “Los desafíos pueden identificarse en la limitada accesibilidad a los datos fuente o a los códigos que generan estimaciones, tablas resumen o gráficos. En salud pública esperamos que los datos tengan acceso restringido, ya sea por poseer información sensible, no anonimizada, el marco legal, o la fragmentación del sistema de colecta de datos”, explicó.
Sin embargo, enfatizó que “ello no limita la posibilidad de acceder al código, paquetes y métodos usados por los analistas a cargo. La accesibilidad al código es una primera etapa de viable implementación. Así mismo, se puede complementar este paso con pequeños conjuntos de datos simulados o reducidos que ejemplifiquen el funcionamiento de dicho código”.
P: Durante los talleres y el seminario, ¿qué prácticas o enfoques espera que los asistentes adopten para fortalecer la calidad y sostenibilidad de sus investigaciones?
R: “Nos enfocamos en comunicar prácticas de mayor utilidad una vez aprendidas y de menor tiempo requerido para aprenderlas. Las tres prácticas que compartimos son: el uso de un compendio de análisis, un ambiente reproducible, y un README”, indicó.
Detalló que “primero, proponemos usar el paquete {rcompendium} para darle una estructura de carpetas y archivos a tu proyecto de análisis, el cual reduce el tiempo de reconocer su estructura y composición entre analistas, incrementando su sostenibilidad. Segundo, proponemos usar el paquete {renv} para registrar el nombre y versión de todos los paquetes que necesita un proyecto, de forma que facilite su reconstrucción por terceros, permitiendo su reproducibilidad en el tiempo. Tercero, proponemos anexar un archivo README que responda brevemente a tres preguntas: ¿qué hace? ¿cómo reusarlo? y ¿puedo reusarlo? y así hacer explícito el nivel de apertura del análisis”.
Estas prácticas, explicó Valle, “pueden suplementar el trabajo de un analista de datos que usa el lenguaje R y Git para el control de versiones, pero los conceptos son trasladables a otros lenguajes de programación”.
P: ¿Cómo visualiza que la formación en análisis reproducible y abierto puede transformar, a mediano y largo plazo, la toma de decisiones en políticas públicas de salud en nuestra región?
R: “A mediano plazo, la incorporación de la reproducibilidad y apertura en análisis de datos podría permitir la transparentización de los métodos y sesgos que se están tomando en cuenta en dichos análisis. Como se replicó durante el seminario: pueden permitir enfocarnos más en el análisis crítico del análisis y usar nuestro tiempo en optimizarlo, en lugar de reescribirlo”, afirmó.
Con visión de futuro, añadió que “a largo plazo, puede posibilitar la creación de 'paquetes' que reduzcan el tiempo necesario para obtener estimaciones, generar proyecciones o comparar escenarios. En R, los 'paquetes' son la unidad fundamental de reproducibilidad y para ello podemos intentar integrar en nuestros equipos de analistas a un nuevo perfil profesional: Ingenieros de Software en Investigación, llamados Research Software Engineers o RSE, por sus siglas en inglés”.
Concluyó que “un RSE tiene la capacidad de adaptar un proyecto reproducible en un 'paquete' listo para su reusabilidad, y darle mantenimiento en el tiempo en base a la retroalimentación y preguntas de usuarios interesados”.
A continuación se puede acceder al registro audiovisual del seminario y a los talleres realizados por Andree Valle Campos: