Imagen: El programa ‘All of Us’ tiene como objetivo reclutar a un millón de personas de grupos étnicos y socioeconómicos que normalmente están subrepresentados en los estudios biomédicos. Crédito: Barbara Alper/Getty
Un ambicioso estudio de la diversidad humana arroja millones de variantes genéticas no descubiertas
El análisis del conjunto de datos genómicos ‘All of Us’comienza a abordar las desigualdades en la investigación genética.
Max Kozlov
Un programa estadounidense masivo que apunta a mejorar la atención médica centrándose en los genomas y perfiles de salud de grupos históricamente subrepresentados ha comenzado a dar resultados.
Los análisis de hasta 245.000 genomas recopilados por el programa ‘All of Us’, dirigido por los Institutos Nacionales de Salud de Estados Unidos en Bethesda, Maryland, han descubierto más de 275 millones de nuevos marcadores genéticos, casi 150 de los cuales podrían contribuir a la diabetes tipo 2. El trabajo también ha identificado lagunas en la investigación genética de poblaciones no blancas. Los hallazgos se publicaron el 19 de febrero en un paquete de artículos en Nature (1) , (2), Communications Biology (3) y Nature Medicine (4) .
Son una “buena destilación del recurso ‘All of Us’: qué es y qué puede hacer”, dice Michael Inouye, genómico computacional de la Universidad de Cambridge, Reino Unido. “Este será el conjunto de datos al que recurrirán” los investigadores en genética que quieran saber si sus hallazgos son generalizables a una población amplia o se aplican sólo a una limitada, añade.
Cerrando la brecha
Los investigadores han reconocido desde hace tiempo la falta de diversidad en los genomas disponibles para estudiar, dice Jibril Hirbo, genetista del Centro Médico de la Universidad de Vanderbilt en Nashville, Tennessee, que estudia la genética de las disparidades en la salud. Un estudio5 que analizó los datos recopilados hasta enero de 2019 encontró que el 78% de las personas en la mayoría de los estudios genómicos sobre enfermedades a gran escala eran de ascendencia europea. Esto ha exacerbado las disparidades de salud existentes, particularmente entre las personas no blancas, dice Hirbo.
Cuando los investigadores eligen objetivos genéticos o moleculares para nuevos medicamentos o crean modelos para predecir quién está en riesgo de desarrollar una enfermedad, tienden a tomar decisiones basándose en datos no diversos porque eso es todo lo que está disponible.
El programa ‘All of Us’, que ha recibido más de 3.100 millones de dólares hasta la fecha y planea reunir perfiles de salud detallados para un millón de personas en Estados Unidos para finales de 2026, tiene como objetivo cerrar esa brecha, dice Andrea Ramírez, jefa de datos del programa oficial. Comenzó a inscribir personas en 2018 y publicó su primer lote de datos (alrededor de 100.000 genomas completos) en 2022. En abril de 2023, había inscrito a 413.000 participantes anónimos, el 46% de los cuales pertenecen a un grupo racial o étnico minoritario, y había compartido casi 250.000 genomas. En comparación, el conjunto de datos de genoma completo más grande del mundo , el Biobanco del Reino Unido, ha publicado hasta ahora alrededor de medio millón de genomas, alrededor del 88% de los cuales son de personas blancas.
El conjunto de datos de ‘All of Us’ es “un recurso enorme, particularmente de genomas afroamericanos, hispanos y latinoamericanos, que falta enormemente en la gran mayoría de los recursos de biobancos y consorcios de genómica a gran escala”, sostiene Alicia Martin, genetista de poblaciones de Massachusetts. Hospital General de Boston.
Además de los genomas, la base de datos incluye las respuestas de algunas encuestas de los participantes, registros médicos electrónicos y datos de dispositivos portátiles, como Fitbits, que informan sobre la actividad de las personas, “lo que lo convierte en uno de los recursos más poderosos de datos genómicos”, explica Martin.
Una necesidad urgente
El estudio publicado en Nature sobre la diabetes tipo 2 es un ejemplo del poder que tiene la posibilidad de utilizar una base de datos que incluya diversos genomas, dice Ramírez. La afección, que afecta aproximadamente a una de cada diez personas en Estados Unidos, puede ser causada por muchos mecanismos biológicos distintos que involucran varios genes. Los investigadores analizaron la información genética de varias bases de datos, incluida ‘All of Us’, de un total de más de 2,5 millones de personas. Casi el 40% de los datos procedían de personas que no son de ascendencia europea. El equipo encontró 611 marcadores genéticos que podrían impulsar el desarrollo y la progresión de la enfermedad, 145 de los cuales nunca se habían informado. Estos hallazgos podrían utilizarse para desarrollar una “atención diabética genéticamente informada”, escriben los autores.
En otro de los estudios (3) , los investigadores utilizaron datos de ‘All of Us’ para examinar variantes patógenas, es decir, diferencias genéticas que aumentan el riesgo de que una persona desarrolle una enfermedad en particular. Descubrieron que, entre los genomas de personas con ascendencia europea, el 2,3% tenía una variante patogénica. Sin embargo, entre los genomas de personas con ascendencia africana, esta proporción cayó al 1,6%.
El coautor del estudio, Eric Venner, genetista computacional del Baylor College of Medicine en Houston, Texas, advierte que no debería haber ninguna razón biológica para las diferencias. Dice que la disparidad es probablemente el resultado de que se han realizado más investigaciones sobre personas de ascendencia europea; simplemente sabemos más sobre qué mutaciones en esta población provocan enfermedades. De hecho, los investigadores encontraron más variantes de riesgo desconocido en los genomas de personas con ascendencia no europea que en aquellos con ascendencia europea, añade.
Esto subraya la urgente necesidad de estudiar con más detalle los genomas no europeos, afirma Venner.
Actualizando modelos
La recopilación y el uso de más datos genómicos y de salud de poblaciones diversas será especialmente importante para generar “puntuaciones de riesgo poligénico” más precisas. Estos proporcionan una imagen del riesgo de una persona de desarrollar una enfermedad como resultado de su genética.
Para calcular una puntuación para una enfermedad en particular, los investigadores desarrollan un algoritmo que se entrena con miles de genomas de personas que padecen o no la enfermedad. Luego se puede calcular la puntuación de una persona ingresando sus datos genéticos en el algoritmo.
Investigaciones anteriores6 han demostrado que las puntuaciones, que pronto podrían utilizarse en la clínica para una atención sanitaria personalizada, tienden a ser menos precisas para las poblaciones minoritarias que para las mayoritarias. En uno de los artículos actuales (4) , los investigadores utilizaron los datos más inclusivos de ‘All of Us’ para mejorar el panorama: calibraron y validaron puntuaciones para 23 afecciones y recomendaron priorizar el uso de 10 en la clínica, para afecciones que incluyen enfermedad coronaria y diabetes. Martin aplaude estos esfuerzos, pero espera que los estudios futuros aborden cómo los médicos y otras personas en la clínica interpretan estas puntuaciones, y si las puntuaciones pueden mejorar la salud de una persona a largo plazo debido a las decisiones de tratamiento que provocan.
El programa ‘All of Us’ planea publicar una serie de datos cada año, que representan nuevos inscritos y genomas, incluido uno más adelante en 2024, dice Ramírez. Es excelente que estén llegando datos tan diversos, afirma Hirbo, y añade que le gustaría ver actualizados pronto los algoritmos existentes que se entrenaron principalmente en los genomas de personas de ascendencia europea. “Los modelos todavía están muy atrasados”, afirma.
doi: https://doi.org/10.1038/d41586-024-00502-0
Referencias
1. The All of Us Research Program Genomics Investigators.Nature https://doi.org/10.1038/s41586-023-06957-x(2024).r
2. Suzuki, K. et al. Nature https://doi.org/10.1038/s41586-024-07019-6(2024).
3. Venner, E. et al. Commun. Biol. https://doi.org/10.1038/s42003-023-05708-y (2024).
4. Lennon, N. J. et al. Nature Med. https://doi.org/10.1038/s41591-024-02796-z(2024).
5. Sirugo, G., Williams, S. M. &Tishkoff, S. A. Cell 177, 26–31 (2019).r
6. Martin, A. R. et al. Nature Genet. 51, 584–591 (2019).