Por: Rhewter Nunes, Wilian W. Cordova, Leonardo C. J. Corvalán, Mayara K. L. Sousa, Moara L. Coelho, Jamira D. Rocha, Isabela P. Souza, Júllia C. dos Reis, Kassia M. C. Miranda, Carmen E. Barragán, Cíntia P. Targueta, Thannya N. Soares, Carolina P. Fontoura, Wellington Hannibal, Carlos M. Silva-Neto, Ramilla dos S. Braga-Ferreira, Renata O. Dias e Mariana P. C. Telles – Especial para o Jornal Opção

Toda forma de vida transporta, em suas células, um longo “texto” escrito em uma linguagem química de apenas quatro letras: A, T, C e G. Esse “texto” é chamado de genoma, que é o conjunto completo de instruções genéticas que define como um organismo se desenvolve, se reproduz, se alimenta e responde ao ambiente. Sequenciar um genoma é, na prática, ler esse “livro” de ponta a ponta e identificar a ordem em que as letras se organizam para formar as palavras que formam o “texto da vida”. E, assim como o cinema e a animação ajudam a aproximar a ciência da sociedade, tema já abordado em outras edições do Araguaia em Foco, a genômica é hoje uma das ferramentas mais poderosas para conhecer, monitorar e conservar a extraordinária e rica biodiversidade da bacia Tocantins-Araguaia.

A bacia Tocantins-Araguaia é a maior bacia hidrográfica inteiramente localizada em território brasileiro, tanto em vazão quanto em área de drenagem. Ela conecta dois dos maiores biomas do país, o Cerrado e a Amazônia, e abriga corredores ecológicos estratégicos, além da maior ilha fluvial do mundo, a Ilha do Bananal. Só de peixes, são mais de 750 espécies registradas, das quais mais de 220 são endêmicas, ou seja, não ocorrem em nenhum outro lugar do planeta. Apesar dessa riqueza, apenas cerca de 3% da área da bacia está sob proteção permanente, e boa parte de sua diversidade biológica ainda é praticamente desconhecida do ponto de vista genético. Um artigo científico identificou as lacunas e padrões macroecológicos em dados genéticos de peixes da bacia Tocantins-Araguaia, mostrando que menos de um terço das espécies de peixes endêmicas dessa região dispõe de algum tipo de recurso genômico disponível nos bancos de dados públicos (qualquer tipo de informação genética). A informação genética pode ser crucial para a identificação de espécies, o monitoramento da biodiversidade por meio de eDNA, o desenvolvimento de estratégias de conservação mais eficientes e o entendimento dos padrões evolutivos das espécies. Esse cenário não é muito diferente para plantas, aves, fungos e outros grupos de organismos. 

Por que sequenciar genomas?

Conhecer o genoma de uma espécie abre portas que vão muito além da curiosidade científica. A informação genética permite reconstruir a história evolutiva dos organismos, entender como as populações se diferenciaram ao longo de milhões de anos, identificar espécies muito parecidas na aparência, mas geneticamente distintas (as chamadas espécies crípticas) e estimar quando linhagens se separaram. Tudo isso é fundamental para responder perguntas básicas de biologia evolutiva e biogeografia: por que a bacia Tocantins-Araguaia é tão rica em espécies? Como os rios e suas conexões moldaram essa diversidade?

Mas há também aplicações muito concretas para a conservação, como por exemplo os bancos de dados genéticos de referência,  onde é possível monitorar a biodiversidade de forma rápida, com melhor custo-benefício e de forma não invasiva, por meio do DNA ambiental (eDNA), analisando o material genético que os organismos deixam na água, no solo ou no ar. Ao invés de capturar e analisar cada indivíduo, basta coletar uma amostra de água e comparar o DNA presente nela com sequências de referência, que devem estar disponíveis nos bancos de dados, para saber quais espécies vivem ali (já abordado em outro artigo do Jornal Opção). Essa abordagem é especialmente útil para detectar espécies invasoras, identificar espécies raras ou ameaçadas e acompanhar populações pequenas. Como já discutido anteriormente aqui na coluna “Araguaia em foco”, o problema é que, para funcionar, o eDNA depende de bibliotecas de referência bem preenchidas e é justamente aí que entra o trabalho de sequenciamento que temos desenvolvido nos projetos Araguaia Vivo (TWRA/FAPEG), PPBio Araguaia (PUC Goiás/CNP), INCT EECBio (UFG/CNPq), CEGGen (PUC Goiás/CNPq) e Rede BioGenomas (PUC Goiás/CNPq).

Há ainda uma dimensão de soberania nacional que precisa ser discutida e enfrentada, tendo em vista que a maioria dos bancos de dados são gerenciados por outros países, não existindo, ainda, um banco de dados genômico da biodiversidade brasileira. As informações genéticas e genômicas de nossa biodiversidade, que passaram a se chamar Informação de Sequência Digital (Digital Sequence Information – DSI) no contexto das negociações internacionais da Convenção sobre Diversidade Biológica (CDB) e do Protocolo de Nagoya, são um patrimônio genético estratégico e estão relacionadas com a soberania sobre recursos genéticos e a repartição de benefícios, de acordo com a legislação brasileira (Lei nº 13.123/2015). Quando um país megadiverso como o Brasil não gera e não assume a guarda de suas informações, torna-se dependente de bancos de dados e serviços estrangeiros e perde autonomia e soberania. Neste contexto, produzir genomas no Brasil, com pesquisadores e estudantes formados no país, é uma forma de garantir que os benefícios científicos e tecnológicos derivados da nossa biodiversidade retornem à sociedade, em consonância com a Convenção sobre Diversidade Biológica (CDB). Além dos avanços científicos e tecnológicos para conhecer a biodiversidade, nosso grupo também tem buscado avançar na formação de recursos humanos qualificados em bioinformática e genômica no Estado de Goiás. visando a difusão do conhecimento e contribuindo com esse aspecto da soberania nacional.

Reunião de pesquisa (“workshop”) para alinhar as boas práticas em Bioinformática realizado no contexto dos diversos projetos na linha de pesquisa em genômica da biodiversidade.

Sequenciar genomas: um esforço de escala planetária

O Brasil não está sozinho nessa empreitada. Sequenciar genomas virou uma corrida mundial. A iniciativa mais ambiciosa nasceu em 2018 e é conhecida como Earth BioGenome Project (“Projeto BioGenoma da Terra”), que reúne mais de 60 projetos afiliados ao redor do planeta com uma meta audaciosa: gerar genomas de referência de alta qualidade para cerca de 1,8 milhão de espécies eucarióticas conhecidas, envolvendo desde fungos e plantas até insetos e vertebrados. Em sua primeira fase, o projeto pretende alcançar 10 mil espécies sequenciadas até o final de 2026 e já reuniu até o momento milhares de genomas representando mais de mil famílias da árvore da vida. A próxima etapa, chamada Fase II, torna essa discussão ainda mais estratégica para países megadiversos como o Brasil. Mais do que ampliar o número de espécies sequenciadas, a proposta internacional passa a defender a criação de capacidades regionais para que os países detentores da biodiversidade também sejam protagonistas na coleta, no armazenamento, no sequenciamento, na montagem, na análise e no uso dos dados genômicos. Para o Brasil, isso significa transformar sua riqueza biológica em conhecimento científico produzido localmente, com soberania, formação de recursos humanos, repartição justa de benefícios e aplicações concretas para conservação, bioeconomia e inovação. Com a Fase III já projetada para avançar até 2035, a meta de longo prazo do Earth BioGenome Project é consolidar uma base genômica global capaz de representar a biodiversidade eucariótica conhecida da Terra, ampliando nossa capacidade de compreender, conservar e manejar de forma sustentável a biodiversidade do planeta. 

É nesse contexto que se consolida a “Rede de Genomas Neotropicais” (Red de Genomas Neotropicales), também chamada BioGenomas, articulada durante uma reunião presencial realizada no Chile, no contexto do workshop do projeto “1000 Genomas Chile”. A iniciativa reúne representantes de países como Brasil, Chile, Argentina, Colômbia, Equador, Uruguai e Panamá, com o objetivo de fortalecer a capacidade latino-americana de produzir, analisar e curar genomas de alta qualidade da biodiversidade desses países. O Brasil será representado na rede por uma de nós (Profa. Mariana Pires de Campos Telles, da PUC Goiás e Universidade Federal de Goiás) e pelo Dr. Alexandre Aleixo (pesquisador do Instituto Tecnológico Vale, ITV, em Belém), que terão a missão de mobilizar pesquisadores, instituições e infraestruturas nacionais envolvidas com a geração de genomas de referência. Essa articulação é um passo estratégico para conectar oficialmente a América Latina ao Earth BioGenome Project como um nodo regional, permitindo que os genomas das espécies neotropicais sejam produzidos com liderança local, padrões internacionais, soberania científica e compromisso com a conservação da biodiversidade. 

Participantes da reunião presencial da Rede de Genomas Neotropicais, realizada no Chile durante o workshop do projeto 1000 Genomas Chile, em maio de 2026, no encontro que marcou a articulação regional para fortalecer a produção de genomas de referência da biodiversidade latino-americana

Esse movimento global só é possível graças ao avanço das tecnologias de sequenciamento de alto desempenho (HTS), que tornaram a leitura de genomas muito mais rápida, precisa e com melhor custo do que era há poucos anos. O que antes custava fortunas e se restringia a poucos marcadores genéticos hoje pode ser feito em maior escala genômica para qualquer espécie de organismo. Basicamente é como se estivéssemos montando um quebra-cabeças, mas usando peças maiores, facilitando recuperar a imagem total com melhor resolução. O desafio, agora, é garantir que a megadiversidade tropical, que está entre as maiores do mundo, mas também entre as menos estudadas, não fique de fora desse grande inventário genético da vida.

Ciência que se faz em rede

Cinema e genômica têm algo em comum: ninguém os constrói nada sozinho.  Nesse sentido, os genomas que temos produzido nascem da colaboração entre instituições, laboratórios e pesquisadores de diferentes lugares do Brasil e do mundo. Um dos eixos centrais deste trabalho é a Rede de Genomas Neotropicais (BioGenomas), uma iniciativa latino-americana voltada à produção, análise e curadoria de genomas de referência da biodiversidade neotropical. Em parceria com o consórcio internacional GenoTropics, essa iniciativa articula instituições do Brasil, da Alemanha, do Chile, da Argentina e da Colômbia e tem como missão padronizar protocolos, formar recursos humanos, fortalecer laboratórios locais e reduzir a dependência de serviços externos.

Esse trabalho se conecta a outros programas de pesquisa de longa data na região, como o PPBio Araguaia (financiado pelo CNPq), o programa Araguaia Vivo (gerenciado pela TWRA com financiamento da FAPEG), o PELD Araguaia (financiado pela FAPEG e pelo CNPq), o Instituto Nacional de Ciência e Tecnologia em Ecologia, Evolução e Conservação da Biodiversidade (INCT EECBio – financiado pelo CNPq), o Centro de Pesquisa Biodiversidade e Serviços Ecossistêmicos (CPBioS – financiado pela FAPEG) e o Centro de Excelência em Genética e Genômica (CEGGen – financiado pela FAPEG). A bioinformática que sustenta as montagens de genomas é desenvolvida em parceria entre o Laboratório de Bioinformática e Biodiversidade (LBB) da Universidade Estadual de Goiás (UEG), em Iporá, e o Laboratório de Genética & Biodiversidade (LGBio) da Universidade Federal de Goiás (UFG). É dessa teia de parcerias, que envolvem estudantes de iniciação científica, mestrado e doutorado, que derivam alguns dos resultados apresentados a seguir.

Os genomas mitocondriais dos peixes da bacia Tocantins-Araguaia

Um primeiro grande passo que avançamos foi na montagem dos genomas das mitocôndrias (as estruturas que produzem energia dentro das células) dos peixes da bacia Tocantins-Araguaia. O DNA mitocondrial é um aliado poderoso para estudos evolutivos: tem herança uniparental materna, não tem recombinação e possui um tamanho pequeno, com estrutura bem conservada, apresentando 37 genes no total. No entanto, até 2025, dos 748 peixes válidos catalogados para a bacia Tocantins-Araguaia, apenas 6,5% tinham algum genoma mitocondrial depositado em bancos de dados públicos.

Em um estudo recente foi possível montar e disponibilizar 76 novos genomas mitocondriais usando exclusivamente dados de sequenciamento que já estavam disponíveis publicamente, mas que ainda não tinham sido explorados para esse fim, um exemplo de como a ciência aberta pode multiplicar o valor dos dados. Neste estudo, foram montados 48 genomas de forma completa e 28 de forma quase completa. Isso inclui representantes de 38 gêneros que anteriormente não possuíam esse tipo de dado para a região. Na prática, isso representa um aumento de 2,5 vezes no número de genomas mitocondriais disponíveis para os peixes da bacia, expandindo significativamente o conhecimento acumulado até o momento (ver um exemplo na Figura 3).

Exemplo de um dos “mapas circulares” da organização de um genoma mitocondrial do peixe acará salema (Biotodoma cupido) gerada no estudo dos mitogenomas de peixes da bacia Tocantins-Araguaia

Com esse material, foi possível reconstruir relações evolutivas entre as espécies e demonstrar, por exemplo, que o conjunto completo de genes mitocondriais oferece um poder para a identificação molecular das espécies (marcadores de DNA Barcode) muito maior do que os marcadores isolados tradicionalmente utilizados. Além disso, esses genomas alimentam diretamente os bancos de referência necessários para o monitoramento por DNA ambiental (eDNA), abrindo caminho para monitorar a saúde dos rios e detectar ameaças à ictiofauna (fauna de peixes) de forma ágil e precisa. Todos os genomas montados foram depositados em bancos de dados públicos internacionais, ficando disponíveis para a comunidade científica mundial, e o artigo científico está sob avaliação para publicação em uma revista científica.

O genoma nuclear da abelha tiúba (Melipona fasciculata)

Se os genomas mitocondriais são pequenos e relativamente simples, o genoma nuclear (o conjunto completo de cromossomos ou “os maiores capítulos do livro da vida”) é um desafio de outra ordem. Um exemplo notável é o da espécie de abelha Melipona fasciculata, uma abelha-sem-ferrão, popularmente chamada de tiúba ou uruçu-cinzenta, nativa do Cerrado e da Amazônia. Trata-se de uma espécie de grande importância ecológica e socioeconômica: é uma excelente polinizadora de plantas nativas e de culturas agrícolas e sustenta a meliponicultura (a criação de abelhas-sem-ferrão) em diversas comunidades locais, incluindo povos indígenas, com produção de mel e própolis.

Abelhas tiúba (Melipona fasciculata) coletadas para realizar o sequenciamento de seu genoma nuclear. Foto: Acervo Pessoal

O genoma dessa abelha é especialmente difícil de montar porque é riquíssimo em sequências repetitivas de DNA (chamadas de heterocromatina), que chegam a representar mais de 60% do genoma e podem fazê-lo variar enormemente de tamanho entre espécies próximas. Ou seja, é como se tentássemos montar um quebra-cabeças onde a maioria das peças possui uma parte repetida várias vezes, dificultando saber qual é o lugar exato de cada uma delas. Usando tecnologias de leitura longa (Oxford Nanopore) combinadas com dados de Hi-C (High-throughput Chromosome Conformation Capture), que são utilizados para mapear a organização tridimensional (3D) do genoma e montar genomas completos em nível de cromossomo, nossa equipe conseguiu montar o primeiro genoma em nível cromossômico para o subgênero Melikerria, reconstruindo nove pseudocromossomos com altíssima qualidade e completude (99,3% dos genes de referência recuperados). Foram preditos mais de 11 mil genes codificadores de proteínas, e a análise da metilação do DNA, uma forma de regulação que não altera a sequência, mas liga e desliga genes, foi realizada a partir das leituras de sequenciamento.

Um dos achados mais interessantes foi a expansão de famílias de genes ligados ao olfato (receptores olfativos – OR) específica da linhagem da M. fasciculata e de outras meliponas. Esses genes são responsáveis por detectar odores e compostos químicos no ambiente, algo essencial para as abelhas, que dependem do olfato para encontrar flores, reconhecer companheiras de ninho e se comunicar. Identificar essa expansão ajuda a entender como essas abelhas se adaptaram a explorar uma grande diversidade de recursos florais e fornece uma base genômica valiosa para a conservação da espécie e para programas de melhoramento e manejo na meliponicultura.

Em desenvolvimento: o genoma da cagaiteira

O trabalho não para por aí. Atualmente, nossa equipe está desenvolvendo o sequenciamento do genoma da cagaiteira (Eugenia dysenterica), uma árvore frutífera nativa e emblemática do Cerrado, da mesma família botânica do eucalipto e da goiabeira (Myrtaceae). A cagaiteira é um importante recurso genético e possui grande relevância ecológica, cultural e econômica na região, com frutos amplamente apreciados e potencial para uso sustentável. Nossos resultados preliminares indicam uma recuperação eficiente dos onze cromossomos da espécie e um genoma estimado em torno de 300 milhões de pares de bases e rico em regiões repetitivas, fazendo dela uma das primeiras plantas frutíferas nativas do Cerrado a ter o genoma completamente caracterizado no nível cromossômico.

Cagaiteira (Eugenia dysenterica) da coleção de germoplasma da Escola de Agronomia da Universidade Federal de Goiás. Foto: Acervo Pessoal

Avançar para um genoma de referência completo e bem montado da cagaiteira permitirá estudar sua diversidade genética, apoiar estratégias de conservação e manejo e desenvolver marcadores moleculares úteis para programas de melhoramento e para a valorização de produtos do Cerrado. É mais uma peça do grande mosaico genômico que estamos ajudando a montar para a biodiversidade da bacia Tocantins-Araguaia.

Um inventário genético para o futuro

Cada genoma montado é um registro de memória evolutiva e, ao mesmo tempo, uma ferramenta para o futuro. Os peixes, a abelha tiúba e a cagaiteira são apenas exemplos do início de um grande esforço que pretende transformar a forma como conhecemos e protegemos a vida não só na bacia Tocantins-Araguaia, mas no Cerrado como um todo. Boa parte desse avanço veio do uso inteligente de dados públicos já existentes e da força do trabalho em rede, uma estratégia fundamental para países megadiversos, onde os recursos para gerar dados em larga escala ainda são limitados diante da complexidade tecnológica e dos investimentos necessários em pesquisa.

Acreditamos, como pesquisadores e pesquisadoras, que sequenciar os genomas das espécies do Araguaia é mais do que uma tarefa técnica: é um gesto de cuidado e de soberania sobre nossa biodiversidade. Ler o “livro da vida” presente nas águas e nas matas dessa imensa bacia é também um convite para conhecer, valorizar e conservar o Rio Araguaia e tudo o que ele abriga.

Confira quem são os autores do artigo

Rhewter Nunes – Professor da Universidade Estadual de Goiás (UEG) e coordenador do Laboratório de Bioinformática e Biodiversidade (LBB), em Iporá. Pesquisador dedicado à genômica e à bioinformática aplicadas ao estudo e à conservação da biodiversidade neotropical.

Wilian W. Cordova – Doutorando e pesquisador em formação no Laboratório de Bioinformática e Biodiversidade (UEG) e no Laboratório de Genética & Biodiversidade (UFG), atuando na montagem e anotação de genomas mitocondriais de peixes da bacia Tocantins-Araguaia.

Leonardo C. J. Corvalán – Doutorando e pesquisador em formação dedicado à genômica de abelhas-sem-ferrão, responsável pela montagem em nível cromossômico do genoma da Melipona fasciculata, no âmbito do Laboratório de Bioinformática e Biodiversidade (UEG) e do Laboratório de Genética & Biodiversidade (UFG).

Mayara K. L. Sousa – Estudante do curso de Ciências Biológicas da UEG de Iporá, bolsista de Iniciação Científica do INCT-EECBio e pesquisadora em formação no Laboratório de Bioinformática e Biodiversidade (UEG), atuando na montagem e anotação de genomas organelares de plantas do Cerrado.

Moara L. Coelho – Mestranda do Programa de Mestrado Profissional em Gestão e Regulação de Recursos Hídricos (ProfÁgua) e pesquisadora em formação no Laboratório de Bioinformática e Biodiversidade (UEG), atuando na montagem e anotação de genomas mitocondriais de peixes exóticos da bacia Tocantins-Araguaia.

Jamira D. Rocha – Pós-doutoranda pelo Programa ProfÁgua da UEG e bolsista de Desenvolvimento Científico e Tecnológico Regional (CNPq e FAPEG) na UEG de Iporá. Tem trabalhado na obtenção de novos genomas organelares, principalmente de peixes e insetos.

Isabela Pavanelli de Souza – Pós-doutoranda pelo Programa ProfÁgua da UEG e bolsista de Desenvolvimento Científico e Tecnológico Regional (CNPq e FAPEG) na UEG de Iporá. Tem trabalhado na obtenção de novos genomas organelares e nucleares, principalmente de plantas.

Júllia C. dos Reis – Doutoranda e pesquisadora em formação no Laboratório de Genética & Biodiversidade (UFG), dedicada ao grupo de Hymenoptera, com foco em abelhas-sem-ferrão, principalmente a espécie Melipona fasciculata, estudando abordagens genômicas e transcriptômicas do grupo.

Kassia M. C. Miranda – Pós-doutoranda, vinculada ao Laboratório de Genética & Biodiversidade (UFG), integrando a equipe da Rede de BioGenomas e do PPBio Araguaia (CNPq).

Cintia P. Targueta – TAE da Escola de Veterinária e Zootecnia (EVZ) da Universidade Federal de Goiás (UFG) e integrando a equipe de pesquisa da Rede de BioGenomas e do programa “Araguaia Vivo 2030” da TWRA e do PPBio Araguaia (CNPq).

Carmen E. Barragán – Pós-doutoranda pelo Araguaia Vivo, vinculada ao Laboratório de Genética & Biodiversidade (UFG), integrando a equipe da Rede de BioGenomas, do PPBio Araguaia (CNPq) e do INCT-EECBio (CNPq).

Thannya N. Soares – Professora da Universidade Federal de Goiás e vinculada ao Laboratório de Genética & Biodiversidade (UFG). Tem coordenado projetos de sequenciamento de genomas de espécies neotropicais, principalmente de plantas e faz parte da equipe da Rede de BioGenomas, do PPBio Araguaia (CNPq) e do INCT-EECBio (CNPq).

Carolina P. Fontoura – Doutoranda do Programa de Pós-Graduação em Biodiversidade e Conservação (IF-Goiano), integrante da equipe do Centro de Pesquisa em Biodiversidade e Serviços Ecossistêmicos (CPBioS) e do Laboratório de Ecologia e Biogeografia de Mamíferos (Lecobioma). Desenvolve pesquisas com pequenos mamíferos, com ênfase em taxonomia, genética (citogenética e identificação molecular de espécies) e avaliação crânio-dentária.

Wellington Hannibal – Professor da Universidade Estadual de Goiás, coordenador do Centro de Pesquisa em Biodiversidade e Serviços Ecossistêmicos (CPBioS) e do Laboratório de Ecologia e Biogeografia de Mamíferos (Lecobioma).

Carlos M. Silva-Neto – Professor da Universidade Estadual de Goiás, unidade Ipameri, servidor do Instituto Federal de Goiás, atuando com flora e vegetação do Cerrado.

Ramilla S. Braga-Ferreira – Professora da Universidade Federal de Goiás, vinculada ao Laboratório de Genética & Biodiversidade (UFG), integrando pesquisas em Genética e Genômica na Rede de BioGenomas, do PPBio Araguaia (CNPq) e do INCT-EECBio (CNPq).

Renata O. Dias – Professora da Universidade Federal de Goiás e vinculada ao Laboratório de Genética & Biodiversidade (UFG). Tem coordenado projetos de sequenciamento de genomas de espécies neotropicais, principalmente de insetos e faz parte da equipe da Rede de BioGenomas, do PPBio Araguaia (CNPq) e do INCT-EECBio (CNPq).

Mariana P. C. Telles – Professora da PUC Goiás e da Universidade Federal de Goiás (UFG), coordenadora-geral do Programa Araguaia Vivo 2030 (TWRA/FAPEG), do PPBio Araguaia (CNPq), INCT-EECBio (CNPq), do Centro de Excelência em Genética e Genômica (CEGGen) e uma das lideranças brasileiras da Rede de Biogenomas Neotropicais (FAPEG).