Este artigo é baseado na discussão do Podcast Lex Fridman: Ouça o episódio aqui.

Nesta conversa, Lex Fridman fala com Dylan Patel e Nathan Lambert sobre os últimos desenvolvimentos em IA, com foco no DeepSeek, nas ambições de IA da China, no papel da NVIDIA na corrida global de IA e no futuro dos megaclusters de IA. A discussão abrange avanços na eficiência de IA, a batalha geopolítica pelo domínio dos semicondutores e os principais participantes que moldam o futuro da inteligência artificial.

A inteligência artificial está evoluindo a uma velocidade vertiginosa, mas não da maneira que a maioria das pessoas espera. 

As manchetes gritam sobre modelos maiores, mais parâmetros e novas capacidades alucinantes. Mas por baixo de todo o hype, uma revolução mais silenciosa está acontecendo: tornando a IA mais eficiente, econômica e geopoliticamente estratégica. 

E se você prestar atenção, notará algo grande: o cenário de IA da China está se acelerando de uma forma que poucos previram.

Modelos de IA mais inteligentes: a abordagem da mistura de especialistas

Não é segredo que modelos de linguagem grandes (LLMs) exigem quantidades obscenas de poder de computação. Treinar um do zero pode custar centenas de milhões de dólares, e executá-lo? Esse é outro poço sem fundo de despesas. O futuro da IA não será decidido apenas por quem tem os melhores algoritmos — será determinado por quem descobrir como construir modelos de IA poderosos sem queimando o PIB de uma nação em custos de servidor. E é exatamente aí que uma grande mudança está acontecendo.

Em vez de aumentar o tamanho dos modelos infinitamente, os engenheiros estão ficando mais inteligentes sobre como esses sistemas realmente funcionam.

 Digitar mistura de especialistas modelos. 

Imagine que você está montando um painel de especialistas, mas em vez de fazer cada especialista trabalhar em cada questão, você ativa apenas aqueles que são mais adequados para o trabalho. É exatamente assim que esses novos modelos funcionam. Em vez de ter uma rede neural gigantesca processando cada solicitação com força total, apenas alguns submodelos "especialistas" acendem a qualquer momento. O resultado? Grandes ganhos em eficiência — reduzindo tanto a computação quanto o consumo de energia — sem sacrificar a inteligência.

Isto não é apenas teórico.

 Alguns dos modelos de IA mais recentes vindos da China estão provando que esse método funciona em aplicações do mundo real. Ao ajustar como a computação é alocada, eles estão obtendo desempenho que rivaliza com os melhores modelos ocidentais, mas por uma fração do custo.

O avanço da otimização de baixo nível

Isso nos leva à próxima grande mudança: otimização de baixo nível.

 A maioria das empresas de IA depende de frameworks de software existentes como CUDA, desenvolvido pela NVIDIA, para treinar seus modelos. Mas esses frameworks não foram projetados para eficiência máxima; eles foram construídos para usabilidade geral. As empresas que estão fazendo avanços reais agora são aquelas que estão reengenharia a maneira como a IA utiliza o hardware. 

Eles não estão apenas usando GPUs; eles estão extraindo até a última gota de desempenho delas, reescrevendo as regras de programação de GPU para tornar os cálculos mais rápidos, mais enxutos e significativamente mais baratos.

A corrida pelo poder de computação

E quando se trata de hardware, o tamanho importa.

 Alguns dos maiores players em IA operam vastos clusters de computação, essencialmente fazendas de servidores gigantes lotadas com dezenas de milhares de GPUs. Para contextualizar, a Meta tem um cluster de treinamento na faixa de 60.000 a 100.000 GPUs equivalentes a H100. Os mais novos modelos de IA da China estão sendo treinados em clusters de aproximadamente 50.000 GPUs — poder de fogo suficiente para acompanhar os melhores do mundo. 

A escala desses investimentos mostra que a IA não é mais apenas uma corrida armamentista da indústria de tecnologia; é uma prioridade nacional.

O tabuleiro de xadrez geopolítico da IA

É claro que o cenário da IA não se trata apenas de quem consegue treinar modelos mais rápido, mas também de quem consegue realmente entender o hardware necessário. E é aí que a geopolítica entra em cena. 

Os EUA implementaram controles de exportação cada vez mais rigorosos em chips de IA de ponta, restringindo sua venda para a China. A NVIDIA respondeu fazendo versões reduzidas de suas GPUs especificamente para o mercado chinês. 

Isso significa que, embora as empresas chinesas de IA ainda possam treinar modelos massivos, elas são forçadas a fazê-lo com hardware um pouco menos potente. Mas aqui está a parte interessante: essas restrições estão pressionando as empresas de IA da China a se tornarem ainda mais mais eficiente. Em vez de forçar brutalmente seu caminho até o topo com computação ilimitada, eles estão sendo forçados a inovar. 

Eles estão otimizando software, repensando arquiteturas e encontrando maneiras de extrair ganhos de desempenho que as empresas ocidentais nem sequer consideraram ainda. As restrições estão, ironicamente, tornando-os concorrentes mais fortes.

Estamos nos aproximando da IAAG?

E então há a questão geral que paira sobre tudo: quão próximos estamos da Inteligência Artificial Geral (IAG)? 

Alguns argumentam que os modelos de hoje já estão mostrando vislumbres disso. A capacidade da IA moderna de se adaptar a múltiplas tarefas — raciocínio, resolução de problemas, criatividade — sugere que podemos estar mais avançados no caminho para a AGI do que as pessoas supõem. 

E com o poder de fabricação da China, ela está posicionada de forma única para acelerar o progresso. Enquanto os EUA e a Europa dominam o software de IA, a China é a espinha dorsal do hardware de IA. Ela controla uma grande parte da cadeia de suprimentos de semicondutores do mundo, o que lhe dá uma vantagem na produção em massa dos chips necessários para treinar e implementar sistemas de IA em escala.

Taiwan: O centro do universo da IA

Isso nos leva a Taiwan, o herói anônimo de toda a corrida global de IA. A Taiwan Semiconductor Manufacturing Company (TSMC) produz os chips de IA mais avançados do mundo. Quase todos os modelos de IA — seja o GPT da OpenAI, o Gemini do Google ou os mais recentes sistemas de aprendizado profundo da China — dependem de chips feitos pela TSMC.

 Se alguma coisa interrompesse a cadeia de suprimentos da TSMC, os efeitos colaterais seriam sentidos em toda a empresa. todo indústria, de smartphones a supercomputadores. A IA não é mais apenas sobre avanços de codificação — é sobre cadeias de suprimentos globais, alianças estratégicas e estabilidade geopolítica.

O futuro da IA: a eficiência vence

Então, onde tudo isso nos deixa? 

A IA está mudando de uma competição de força bruta de “quem tem o maior modelo” para um jogo muito mais estratégico de eficiência, domínio de hardware e posicionamento geopolítico. As empresas (e países) que descobrirem como otimizar, dimensionar e implementar a IA de forma eficiente serão as que dominarão o futuro. E se você não estiver prestando atenção a essas mudanças, estará perdendo a história real de para onde a IA está indo.

Não se trata apenas de demonstrações chamativas ou pontuações de benchmark que quebram recordes.

 É sobre quem na verdade vence a corrida da IA no longo prazo — quem constrói modelos que não são apenas poderosos, mas também práticos, escaláveis e sustentáveis. E essa corrida? Está ficando mais interessante a cada dia.

Postado por Leão Jiang
POSTAGEM ANTERIOR
Você também pode gostar

Deixe seu comentário:

O seu endereço de email não será publicado. Campos obrigatórios marcados com *