Este artigo foi publicado originalmente em A conversa. A publicação contribuiu com o artigo para Space.com’s Vozes de especialistas: artigos de opinião e insights.
Todos os anos, empresas e agências espaciais lançar centenas de foguetes ao espaço – e esse número deverá crescer dramaticamente com missões ambiciosas à Lua, Marte e mais além. Mas estes sonhos dependem de um desafio crítico: a propulsão – os métodos utilizados para impulsionar foguetes e naves espaciais.
Aprendizado de máquina e aprendizado por reforço
O aprendizado de máquina é um ramo da IA que identifica padrões em dados para os quais não foi explicitamente treinado. É um vasto campo com filiais própriascom muitas aplicações. Cada ramo emula a inteligência de diferentes maneiras: reconhecendo padrões, analisando e gerando linguagem ou aprendendo com a experiência. Este último subconjunto em particular, comumente conhecido como aprendizagem por reforçoensina as máquinas a realizar suas tarefas avaliando seu desempenho, permitindo-lhes melhorar continuamente através da experiência.
Como exemplo simples, imagine um jogador de xadrez. O jogador não calcula cada movimento, mas reconhece padrões ao jogar mil partidas. A aprendizagem por reforço cria conhecimentos intuitivos semelhantes em máquinas e sistemas, mas a uma velocidade e escala computacional impossíveis para os humanos. Ele aprende por meio de experiências e iterações observando seu ambiente. Essas observações permitem que a máquina interprete corretamente cada resultado e implante as melhores estratégias para que o sistema atinja seu objetivo.
A aprendizagem por reforço pode melhorar a compreensão humana de sistemas profundamente complexos – aqueles que desafiam os limites da intuição humana. Pode ajudar a determinar o máximo trajetória eficiente para uma nave espacial indo para qualquer lugar no espaço, e faz isso otimizando a propulsão necessária para enviar a nave até lá. Também pode potencialmente projetar melhores sistemas de propulsãodesde a seleção dos melhores materiais até a criação de configurações que transferem calor entre as peças do motor com mais eficiência.
Aprendizagem por reforço para sistemas de propulsão
No que diz respeito à propulsão espacial, a aprendizagem por reforço geralmente se enquadra em duas categorias: aquelas que auxiliam durante a fase de projeto – quando os engenheiros definem as necessidades da missão e as capacidades do sistema – e aquelas que apoiam operação em tempo real quando a espaçonave estiver em vôo.
Entre os conceitos de propulsão mais exóticos e promissores está propulsão nuclearque aproveita as mesmas forças que alimentam as bombas atômicas e alimentam o sol: fissão nuclear e fusão nuclear.
A fissão funciona dividindo átomos pesados como urânio ou plutônio para liberar energia – um princípio usado na maioria dos reatores nucleares terrestres. A fusão, por outro lado, funde átomos mais leves como o hidrogénio para produzir ainda mais energia, embora exija condições muito mais extremas para ser iniciada.
A fissão é uma tecnologia mais madura que foi testada em alguns protótipos de propulsão espacial. Foi até usado no espaço na forma de geradores termoelétricos de radioisótoposcomo aqueles que alimentou as sondas Voyager. Mas a fusão continua a ser uma fronteira tentadora.
Propulsão térmica nuclear poderia um dia levar naves espaciais a Marte e além, a um custo menor do que simplesmente queimar combustível. Levaria uma nave até lá mais rápido do que propulsão elétricaque utiliza um gás aquecido feito de partículas carregadas chamado plasma.
Ao contrário destes sistemas, a propulsão nuclear depende do calor gerado pelas reações atômicas. Esse calor é transferido para um propelente, normalmente o hidrogênio, que se expande e sai através de um bocal para produzir impulso e impulsionar a nave para frente.
Então, como o aprendizado por reforço pode ajudar os engenheiros a desenvolver e operar essas tecnologias poderosas? Vamos começar com o design.
O papel da aprendizagem por reforço no design
Os primeiros projetos de propulsão térmica nuclear da década de 1960, como os do projeto da NASA Programa NERVAusou combustível de urânio sólido moldado em blocos em forma de prisma. Desde então, os engenheiros têm explorado configurações alternativas – desde camadas de seixos cerâmicos até anéis ranhurados com canais intrincados.
Por que houve tanta experimentação? Porque quanto mais eficientemente um reator consegue transferir calor do combustível para o hidrogênio, mais empuxo ele gera.
Esta área é onde a aprendizagem por reforço provou ser essencial. Otimizar a geometria e o fluxo de calor entre o combustível e o propelente é um problema complexo, que envolve inúmeras variáveis – desde as propriedades do material até a quantidade de hidrogênio que flui através do reator em um determinado momento. O aprendizado por reforço pode analisar essas variações de projeto e identificar configurações que maximizam transferência de calor. Imagine-o como um termostato inteligente, mas para um motor de foguete – do qual você definitivamente não quer ficar muito perto, dadas as temperaturas extremas envolvidas.
Aprendizagem por reforço e tecnologia de fusão
A aprendizagem por reforço também desempenha um papel fundamental no desenvolvimento da tecnologia de fusão nuclear. Experimentos em larga escala, como o Tokamak JT-60SA no Japão estão a ultrapassar os limites da energia de fusão, mas o seu enorme tamanho torna-os impraticáveis para voos espaciais. É por isso que os pesquisadores estão explorando projetos compactos, como polywells. Esses dispositivos exóticos parecem cubos ocos, com cerca de alguns centímetros de diâmetro, e confinam o plasma em campos magnéticos para criar as condições necessárias para a fusão.
Controlando campos magnéticos dentro de um polywell não é pouca coisa. Os campos magnéticos devem ser suficientemente fortes para manter os átomos de hidrogénio em movimento até se fundirem – um processo que exige imensa energia para começar, mas que pode tornar-se autossustentável uma vez iniciado. A superação deste desafio é necessária para escalar esta tecnologia para propulsão térmica nuclear.
Aprendizagem por reforço e geração de energia
No entanto, o papel da aprendizagem por reforço não termina com o design. Pode ajudar a gerir o consumo de combustível – uma tarefa crítica para missões que devem se adaptar rapidamente. Na indústria espacial atual, há um interesse crescente em naves espaciais que podem desempenhar diferentes funções, dependendo das necessidades da missão e de como se adaptam às mudanças de prioridade ao longo do tempo.
As aplicações militares, por exemplo, devem responder rapidamente às mudanças nos cenários geopolíticos. Um exemplo de tecnologia adaptada a mudanças rápidas é LM400 da Lockheed Martin satélite, que possui capacidades variadas, como alerta de mísseis ou sensoriamento remoto.
Mas esta flexibilidade introduz incerteza. Quanto combustível uma missão exigirá? E quando será necessário? O aprendizado por reforço pode ajudar nesses cálculos.
Das bicicletas aos foguetões, a aprendizagem através da experiência – seja humana ou mecânica – está a moldar o futuro da exploração espacial. À medida que os cientistas ultrapassam os limites da propulsão e da inteligência, a IA desempenha um papel crescente nas viagens espaciais. Pode ajudar os cientistas a explorar dentro e fora do nosso sistema solar e a abrir as portas para novas descobertas.




