Pesquisas têm revelações sobre formação dos povos brasileiro e peruano
Artigos em revistas internacionais tratam da ancestralidade genética dos latino-americanos
Dois artigos publicados por pesquisadores do Laboratório de Diversidade Genética Humana do Instituto de Ciências Biológicas (ICB) trazem importantes contribuições com base em dados de alta densidade genômica dos projetos Epigen-Brasil e Genoma Peruano. Os estudos, cujas conclusões estão nos periódicos Genome Research e Proceeding of the National Academy of Sciences (PNAS), contaram com participação de pesquisadores de diversas áreas do conhecimento, liderados na UFMG pelo professor Eduardo Tarazona Santos.
As duas publicações referem-se à ancestralidade genômica dos latino-americanos e seu impacto sobre doenças como diabetes, hipertensão, asma e doença de Chagas.
Na Genome Research, o artigo Epigen-Brazil Initiative resources: a Latin American imputation panel and the Scientific Workflow responde, segundo Eduardo Tarazona, a dois grandes desafios da área: a sub-representação persistente e severa de indivíduos não europeus em estudos de diversidade do genoma humano e a falta de transparência e reprodutibilidade de todo o processo científico, incluindo protocolos de bioinformática.
O professor explica que a partir de dados de 265 brasileiros das regiões Nordeste, Sudeste e Sul, com maior densidade de informação em relação ao set completo de 6.487 indivíduos do projeto Epigen-Brasil, foi possível criar um painel de imputação que permite enriquecer conjuntos de dados genômicos de brasileiros.
“O acréscimo de 265 indivíduos com genomas mais similares aos da população do Brasil e da América Latina, ou seja, a particularidade da miscigenação com africanos, europeus e nativos, melhora a qualidade da imputação em relação a outros painéis públicos e aumenta as chances de se encontrar biomarcadores genéticos na população brasileira em estudos de susceptibilidade a doenças. Até então, essa particularidade era sub-representada nos bancos disponíveis, como no Projeto 1000 Genomes, até então considerado padrão ouro para populações latino-americanas”, observa.
Além disso, os autores esperam que outros grupos de pesquisa se beneficiem do painel, aumentando a densidade de seus dados e enriquecendo seus estudos. “Caso um grupo possua apenas 10 variantes genéticas relacionadas à asma, pelo painel de imputação poderá obter as 90 variantes faltantes e completar suas análises”, exemplifica Tarazona. Disponível na internet em domínio público, desde julho deste ano, o painel já está sendo utilizado por grupos da Fundação Osvaldo Cruz (Fiocruz), no Rio de Janeiro, e da Universidade Federal do Paraná (UFPR).
Transparência, reprodutibilidade e bigdata
Para enfrentar o desafio mundial de falta de transparência e reprodutibilidade de todo o processo científico por parte dos grupos que trabalham com big data, o mesmo artigo apresenta a ferramenta computacional Epigen-Brazil Scientific Workflow.
“Descrever cada passo da pesquisa é um desafio, pois estamos muito focados no resultado final, com a publicação dos estudos, mas pouco empenhados em cuidar para que todo o processo de análise seja transparente e reproduzível. E isso é fundamental porque, diante da crescente quantidade de artigos atualmente publicados, existem muitos resultados falsos positivos e, com certeza, até resultados errados”, observa Tarazona.
“Quando se trabalha com big data, como nessa pesquisa, são 12 milhões de variantes para cada um dos mais de seis mil indivíduos genotipados. Com esse volume de informações, precisamos mais do que uma pequena planilha de Excel para visualizar o conjunto de dados e verificar os erros. Contamos com a ajuda de estatísticos e cientistas da computação, além de biólogos e epidemiologistas, para criar programas capazes de tratar uma planilha com 10 milhões de colunas por seis mil linhas utilizando estruturas de dados mais avançadas, derivadas das ciências da computação, com dados que são continuamente transformados”, justifica o pesquisador.
O Workflow é o fluxo de trabalho científico que inclui quatro componentes independentes (publicações científicas, fluxogramas, manuscritos e documentos) que representam diferentes estágios do processo científico – da definição de perguntas até a publicação dos resultados. “Disponibilizamos as análises realizadas, os programas de computador desenvolvidos, e documentos relacionados ao projeto, como detalhamento da extração do DNA e algumas versões dos artigos e dos documentos completos que os referenciam”, enumera o professor do ICB.
Genoma peruano
O artigo Evolutionary genomic dynamics of Peruvians before, during, and after the Inca, publicado no Proceeding of the National Academy of Science, é o primeiro estudo em alta resolução do Projeto Genoma Peruano, que possibilita inferir a história desse povo antes, durante e depois do Império Inca. A parceria do Projeto Epigen-Brasil, do qual participam pesquisadores do Laboratório de Diversidade Genética Humana do ICB, com o Instituto Nacional de Salud do Peru e a Universidade de Maryland, viabilizou a pesquisa inédita, que analisou diversas populações e suas milhares de variantes genéticas.
O professor Tarazona, que liderou os pesquisadores da UFMG, explica que o Projeto Genoma Peruano resguarda a diversidade genética desse povo, cujo componente indígena representa de 60% a 70% da ancestralidade – no Brasil, a participação indígena é inferior a 10%, em média. “Com a expertise da UFMG em suporte informático e analítico, foi possível realizar estudos genômicos mais detalhados e não apenas quantificar, por exemplo, o percentual de genes africanos, europeus ou nativos que um indivíduo tem. Conseguimos registrar como, ao longo do tempo, essa miscigenação aconteceu”, comemora Tarazona, que é de origem peruana.
Uma novidade revelada no artigo é que a miscigenação nativo-americana no Peru tende a ser local, ou seja, indígenas da Amazônia são originários da própria Amazônia, e eles se diferenciam um pouco dos miscigenados dos Andes, que, por sua vez, se distinguem dos mestiços da costa peruana, que também se miscigenaram entre si.
Segundo o professor, diante das análises do big data do Projeto Genoma Peruano, é possível também observar as diferenças entre a dinâmica da miscigenação no Brasil e no Peru. Enquanto no Brasil a miscigenação nativa ocorreu imediatamente após a chegada dos europeus, há pouco menos de 500 anos, com forte presença de portugueses e alguma participação de nativos, no Peru, o boom da miscigenação nativa ocorreu nos últimos 300 anos após a chegada dos espanhóis.
Na avaliação de Tarazona, isso tem relação com o fato de que, para que a miscigenação ocorra, não basta que nativos e estrangeiros se juntem no mesmo território. “Afinal, ela sempre ocorreu. Isso se explica, talvez, porque, no Peru, os europeus se estabilizaram mais nas cidades grandes, diferentemente do que ocorreu no Brasil, onde a população está mais distribuída pelo território. Provavelmente, no Peru, a maior miscigenação se deu quando os indígenas chegaram às grandes cidades, principalmente nos últimos 200 anos”, observa o professor do ICB, que faz outra inferência que ajuda a explicar as diferenças na formação do perfil demográfico dos dois países. “Durante o Império Inca, a população peruana era numerosa, ao contrário do Brasil, onde a densidade populacional era menor quando da chegada dos europeus.”
Outra novidade revelada pela pesquisa conjunta é a particularidade da miscigenação do povo peruano entre indígenas e africanos, enquanto a maioria das populações latino-americanas resulta da mistura de europeus e africanos. “O Peru, talvez a Bolívia e uma população específica em Honduras, os Garifunas, são os únicos nas Américas nos quais essa miscigenação entre africanos e indígenas aconteceu de forma mais evidente”, pontua Eduardo Tarazona.
Genômica e doenças
O Projeto Estratégico do Ministério da Saúde Epigen-Brasil é a maior iniciativa latino-americana voltada para o estudo da diversidade genômica de populações miscigenadas e de seus efeitos em doenças complexas no Brasil. Além da UFMG, envolve o Centro de Pesquisa René-Rachou, da Fundação Oswaldo Cruz, as universidades federais da Bahia e de Pelotas e o Instituto do Coração da Universidade de São Paulo. O grupo estuda a composição genética de 6.487 brasileiros de três coortes populacionais do país: Bambuí, em Minas Gerais, Salvador, na Bahia, e Pelotas, no Rio Grande do Sul.