À medida que avançamos para o terceiro ano da revolução da IA generativa, a inteligência artificial está passando por uma mudança sísmica. O foco está em transição de respostas rápidas e pré-treinadas (“pensar rápido”) para inteligência deliberada e orientada pelo raciocínio no momento da inferência (“pensar devagar”). Essa evolução está impulsionando uma nova geração de aplicativos agênticos, remodelando indústrias e redefinindo possibilidades.
A estabilização da camada de fundação da IA generativa
O mercado de IA generativa atingiu uma fase de estabilização crucial. Gigantes da indústria como Microsoft/OpenAI, AWS/Anthropic, Meta e Google/DeepMind fortaleceram suas posições dentro da camada de fundação. Apoiadas por capital significativo e modelos econômicos eficientes, essas parcerias tornaram as previsões do próximo token mais rápidas, mais baratas e mais acessíveis.
No entanto, à medida que a camada de base se estabiliza, os holofotes mudam para o camada de raciocínio — o domínio da resolução deliberada de problemas e operações cognitivas. Esse pensamento do “Sistema 2” vai além do reconhecimento de padrões, focando em modelos de IA capazes de raciocinar e tomar decisões no momento da inferência. Inspirada por avanços como o AlphaGo, essa camada está transformando a maneira como a IA resolve problemas complexos do mundo real.
Do Software como Serviço (SaaS) ao Serviço como Software
A IA generativa está quebrando barreiras, nos levando do modelo SaaS para um paradigma revolucionário: Serviço como Software. Aqui, a IA não fornece apenas ferramentas — ela executa o trabalho em si. Essa mudança desbloqueia uma oportunidade de mercado de um trilhão de dólares, redefinindo setores como suporte ao cliente, segurança cibernética e desenvolvimento de software.
Pegar Serra, um agente de suporte ao cliente com tecnologia de IA. As empresas não pagam mais por licenças de software; elas pagam por problema resolvido. Essa abordagem orientada a resultados exemplifica o Service-as-a-Software: entregando resultados mensuráveis. Da mesma forma, Copiloto do GitHub evoluiu de auxiliar desenvolvedores para automatizar fluxos de trabalho de codificação inteiros e XBOW revoluciona a segurança cibernética com testes de penetração contínuos baseados em IA.
Raciocínio em tempo de inferência: a próxima fronteira
O salto das respostas instintivas (“Sistema 1”) para o raciocínio deliberado (“Sistema 2”) marca o próximo passo transformador na IA. Modelos como o OpenAI o1 (Morango) estão sendo pioneiros nessa mudança, introduzindo a “computação em tempo de inferência” — permitindo que os modelos pausem, avaliem e raciocinem antes de responder.
Essa inovação já revolucionou domínios como codificação, matemática e pesquisa científica. Inspirados pela inovadora estrutura de tomada de decisão da AlphaGo, esses avanços desbloqueiam capacidades cognitivas sem precedentes, abrindo caminho para a IA enfrentar desafios cada vez mais complexos.
Arquiteturas cognitivas: enfrentando a complexidade do mundo real
Enquanto os modelos de raciocínio de uso geral avançam, as aplicações do mundo real exigem arquiteturas cognitivas específicas de domínio. Essas arquiteturas emulam fluxos de trabalho humanos, dividindo tarefas em etapas lógicas e discretas.
Por exemplo, Droides da fábrica automatizar tarefas de engenharia de software como revisar solicitações de pull, executar testes e mesclar código. Ao combinar modelos de base com lógica de aplicativo, guardrails de conformidade e bancos de dados especializados, as arquiteturas cognitivas criam soluções práticas e inteligentes adaptadas às necessidades do setor.
Aplicações Agentic: Redefinindo o Mercado
As capacidades de raciocínio da IA generativa estão a impulsionar uma onda de aplicações de agente — Ferramentas de IA que tomam iniciativa e entregam resultados tangíveis. Exemplos incluem:
- Harvey: Assistente jurídico com tecnologia de IA
- Recolher: Assistente de trabalho de IA
- Resumir: Escriba médico de IA
- XBOW: Pentest de IA
- Serra: Agente de suporte ao cliente de IA
Ao reduzir o custo marginal de entrega desses serviços, os aplicativos agentic tornam ferramentas sofisticadas acessíveis a empresas de todos os tamanhos. Por exemplo, o pentesting automatizado do XBOW democratiza a segurança cibernética, permitindo que as empresas conduzam avaliações regulares de forma acessível.
Escalonamento da computação em tempo de inferência: o futuro da IA
O próximo capítulo da inovação da IA depende da escala computação de tempo de inferência. O modelo o1 da OpenAI introduz uma nova lei de escala: quanto mais computação for alocada no momento da inferência, melhores serão as capacidades de raciocínio. Essa mudança impulsionará o surgimento de nuvens de inferência — ambientes dinâmicos que ajustam os recursos de computação com base na complexidade da tarefa.
Imagine modelos capazes de raciocinar por horas ou dias. Essa capacidade pode levar a descobertas inovadoras em matemática, biologia e outros campos, resolvendo problemas antes considerados intransponíveis. A transição de clusters massivos de pré-treinamento para nuvens de inferência ágeis marca um marco significativo no desenvolvimento de IA.
Oportunidades na Camada de Aplicação
Para startups e investidores, a camada de aplicação oferece as oportunidades mais promissoras para inovação. Enquanto os hiperescaladores dominam a camada de fundação, a camada de aplicação permite a criação de soluções específicas de domínio que abordam problemas do mundo real com precisão.
Ao aproveitar arquiteturas cognitivas personalizadas e recursos de raciocínio, as startups podem projetar ferramentas que se integram perfeitamente aos fluxos de trabalho, eliminando a lacuna entre modelos de uso geral e aplicações práticas.
Considerações finais
Assim como a IA está mudando o mundo em um ritmo incrível, também está mudando o cenário empresarial, por exemplo, como as empresas competem e crescem. O motivo é que “o custo de produção para fazer um produto ou serviço, entregando experiência ao cliente” é frações do que era. Graças à IA, ela liberou o fator “10x”.
Aqui estão três opiniões pessoais sobre o futuro dos negócios e da IA com base em minhas experiências no crescimento da GroundAI e no atendimento aos nossos clientes.
- Evolução de PLG para ALG. O SLG (crescimento liderado por vendas) e o PLG (crescimento liderado por produtos) tradicionais não são mais tão eficazes, dado que a base de clientes não se expandiu na velocidade do ganho de produtividade. Portanto, o crescimento está se inclinando fortemente para a rede de distribuição. uma nova abordagem quando se trata de atingir seu público. Eu chamei isso de ALG, crescimento liderado pelo público. O ponto crucial é como você envolve seu público efetivamente em diferentes plataformas.
- A aceleração das empresas de tecnologia chinesas se aventurando no exterior, mas com uma história de duas cidades.
Empresas B2C ou B2B SaaS em massa ($20 ~ $100/mês), por exemplo, talkie.ai, runcomfy.com, estão tomando forma e se classificando entre as 3 primeiras em seu espaço. Muitas dessas startups são feitas de uma equipe de desenvolvimento de menos de cinco, mas impulsionadas por uma abordagem muito sofisticada de SEO e ALG. Por outro lado, as grandes empresas de SaaS/Software (50 mil ~ 100 ACV) ainda estão lutando para ganhar participação de mercado, principalmente devido a um problema que chamei de "ajuste de mercado do fundador" - o fundador não consegue localizar sua mentalidade para criar um plano de execução consistente para desembarcar e expandir fora da China, mas muitas delas estão contratando ativamente talentos estrangeiros com ofertas atraentes, por exemplo, até US$ 350 mil/ano - Mudança de paradigma de software como serviço para “serviço como software”. Os recursos de LLM estão avançando mais rápido do que antecipamos, por exemplo, a capacidade de raciocínio de O1 e O3 da OpenAi. No entanto, a “última milha” de entrega desses recursos para clientes empresariais ainda não chegou. É por isso que vemos a proliferação de startups de serviços de agentes de IA, mas, infelizmente, elas resolvem apenas 20 ~ 30% das necessidades empresariais. É por isso que a maioria das startups de IA oferece serviços ou ganha dinheiro com “serviços”. Re: meu artigo “Por que o principal SaaS de IA está cobrando $20/mês.
A IA generativa está redefinindo os limites do software e dos serviços, inaugurando uma era em que a IA realiza o trabalho por si mesma. À medida que fazemos a transição de Software como serviço para Serviço como Software, o potencial para transformar indústrias e criar novos mercados é inigualável. O foco não está mais em imitar a inteligência humana, mas em raciocinar, adaptar e entregar resultados que remodelam o que é possível.
A questão agora não é se a IA pode evoluir, mas como ela redefinirá a maneira como trabalhamos, inovamos e resolvemos os problemas mais complexos do mundo.
Inscreva-se para receber atualizações sobre as últimas postagens do blog
Deixe seu comentário: