Apesar das proibições de chips nos EUA, o ecossistema de IA da China superou as expectativas, atraindo especialmente a atenção internacional de desenvolvedores, já que a série Qwen de código aberto do Alibaba foi amplamente adotada e discutida na comunidade

A China criou um ecossistema de IA completamente separado por vários motivos: 1) para diminuir a dependência do Ocidente e 2) as restrições de censura do Grande Firewall; mas isso não quer dizer que a inovação seja sufocada.

Há um conjunto extremamente vibrante de participantes na China atualmente no ecossistema de IA, e hoje vamos nos aprofundar no papel que o Alibaba desempenha nesse espaço.

EmpresaCamada de InfraestruturaCamada de modeloCamada de Aplicação
AlibabaO Alibaba Cloud oferece uma infraestrutura de nuvem robusta com suporte para modelos de código aberto e serviços abrangentes de IA.Qwen-72B e Qwen-1.8B são LLMs avançados desenvolvidos pela Alibaba Cloud, com recursos em processamento multimodal.Dingtalk, plataforma de bate-papo empresarial Alimama, conjunto de ferramentas de otimização de anúncios orientadas por IA para PMEs que vendem no Tmall e no Taobao.
TencentA Tencent aprimora seus recursos de IA por meio de sua Rede Inteligente de Alto Desempenho, otimizando o uso de GPU para treinamento LLM.Hunyuan é o LLM interno da Tencent voltado para aplicativos empresariais, com foco em eficiência e custo-benefício.Os serviços de IA da Tencent incluem feeds de notícias personalizados e soluções de chatbot em seus aplicativos existentes.
HuaweiA Huawei Cloud fornece uma infraestrutura de alto desempenho adaptada para aplicações de IA, com foco na autossuficiência em tecnologia.O Pangu 3.0 consiste em modelos fundamentais, específicos do setor e de cenário, projetados para diversas aplicações em vários setores.Os LLMs da Huawei são usados em vários setores, como finanças e saúde, para aprimorar os esforços de transformação digital.
ByteDançaA ByteDance utiliza sua infraestrutura de nuvem para dar suporte à implantação de seus LLMs, enfatizando a eficiência de custos em serviços de IA.Doubao é uma família de LLMs lançada pela ByteDance, projetada para diversas aplicações com estratégias de preços agressivas.Aplicativos como o Doubao Chatbot e outras ferramentas de IA generativa visam melhorar a interação do usuário e a geração de conteúdo.
BaiduO Baidu Cloud fornece uma infraestrutura abrangente para treinamento e implantação de modelos de IA, com foco em avanços tecnológicos em IA.Ernie é o principal LLM do Baidu, que viu melhorias significativas na eficiência do treinamento e no desempenho do aplicativo ao longo do tempo.Os aplicativos do Baidu utilizam o Ernie para recursos de pesquisa aprimorados, agentes de conversação e outras soluções baseadas em IA.

Joe Tsai fala sobre a estratégia de IA do Alibaba, com foco no suporte à infraestrutura de IA alavancando seus negócios de nuvem existentes.

Manual de IA do Alibaba

O Alibaba investe em IA de cinco maneiras principais com uma estratégia dupla.

Estratégia de pilha de tecnologia de ponta a ponta:

  1. Construindo LLM proprietário – Qwen e oferecendo seus LLMs para construtores de IA  
  2. Serviço de computação em nuvem
  3. Projetando chips para processamento de aplicações de IA.

Estratégia Ecossistêmica:

  1. Implementando IA em seus aplicativos existentes voltados para o consumidor 
  2. Financiando empresas de IA em todo o ecossistema 

O Alibaba é facilmente a empresa de tecnologia chinesa mais conhecida internacionalmente com um negócio de nuvem líder e sua própria tecnologia LLM proprietária. Embora na China, Baidu e Huawei tenham seus próprios modelos e serviços de nuvem, a estratégia focada em dados do Baidu sempre foi mais focada em sua tecnologia de direção autônoma e a Huawei sempre foi mais focada em computação e hardware, enquanto seu LLM é visto mais como um complemento "bom de se ter" para clientes corporativos. 

Em contraste, o Alibaba disse repetidamente que pretende “tornar a IA acessível a todos”. Na Conferência Apsara de 2024, O CEO do Alibaba, Eddie Wu, enfatizou que a empresa está comprometida em dar suporte ao ecossistema de código aberto, desde chips, servidores e redes até armazenamento e data centers. 

LLM proprietário: Tongyi Qianwen (Qwen)

Na vanguarda das ofertas de IA do Alibaba está o Tongyi Qianwen, um grande modelo de linguagem semelhante a um "super chatbot". Este modelo avançado é capaz de entender e gerar texto, tornando-o adequado para uma ampla gama de aplicações, incluindo geração de artigos, respostas conversacionais e suporte ao cliente. 

A série Qwen – tem escala incrível, desempenho em benchmarks, recursos multimodais e comprometimento com acessibilidade para uma ampla gama de usuários. O Alibaba tornou essa tecnologia disponível publicamente, permitindo que outras empresas a utilizem gratuitamente para aprimorar suas capacidades de atendimento ao cliente.

“É o LLM chinês mais competitivo quando comparado a outros como o GPT4/4.o em termos de desempenho geral”, disse Leo Jiang, fundador da GroundAI e ex-diretor digital da Huawei. 

Ele acrescentou que o que torna o Qwen especial é por causa de seus dois formatos, “seu serviço LLM orientado por API oferece tempo de comercialização mais rápido e custo-efetividade. Enquanto sua versão de código aberto dá mais controle e privacidade aos seus clientes.”

O Alibaba lançou sua grande ferramenta de desenvolvimento de linguagem Tongyi Qianwen em 2023 e é frequentemente chamada de Qwen e agora está em sua iteração 2.5. Os modelos Qwen, incluindo o Qwen-72B e o Qwen-1.8B, são notáveis por seus diversos tamanhos de parâmetros — variando de 1,8 bilhão a 72 bilhões de parâmetros — e suas capacidades multimodais, que permitem que eles processem não apenas texto, mas também dados de áudio e visuais.

Essa flexibilidade é aprimorada pelo treinamento em mais de 3 trilhões de tokens, permitindo que eles superem muitos outros modelos de código aberto em vários benchmarks, incluindo precisão multitarefa e recursos de geração de código.

A Qwen se posicionou como uma assistente de IA completa, com cinco casos de uso de aplicação principais: 

1) transcrição e resumos de reuniões em tempo real 

2) processar conteúdo extenso e fornecer resumos que exigem compreensão complicada 

3) Criação de apresentação de PowerPoint com IA 

4) tradução simultânea em tempo real

5) converse por vídeo com um agente de IA que pode solucionar problemas.

Fonte: Alibaba

A singularidade do Qwen está em sua tecnologia impressionante e forte comprometimento com os princípios de código aberto, já que o Alibaba disponibiliza várias versões de seus modelos em plataformas como Hugging Face e ModelScope. Algumas pessoas ficaram intrigadas sobre o motivo pelo qual a empresa escolheu abrir seu modelo para outros, já que ela estava investindo capital em IA e agora apenas dando seu prêmio de graça. No entanto, a empresa tem sido inflexível sobre torná-lo acessível a todos, pois enfatizou que essa abordagem promove um ambiente colaborativo onde os desenvolvedores podem experimentar e inovar juntos. A monetização pode vir depois e o Alibaba certamente encontrará maneiras de fazer isso, mas, até agora, ele surgiu como um jogador-chave na democratização do acesso a tecnologias avançadas de IA para todos. 

O Alibaba vem treinando amplamente seus modelos de IA de código aberto em dados disponíveis publicamente em seus aplicativos, como seu aplicativo de mercado de e-commerce Taobao, uma enorme vantagem competitiva, dado que os usuários ativos mensais são mais de 930 milhões. Ao abrir seus modelos proprietários, ele levantou um debate sobre se os modelos de IA de código aberto – que geralmente são mais transparentes e econômicos – são realmente mais propensos a abusos também. 

Em particular, empresas com menos de 100 milhões de usuários ativos mensais podem usar esses modelos gratuitamente, promovendo uma adoção mais ampla em todos os setores. Ao apoiar o crescimento da comunidade de código aberto, o Alibaba tem como objetivo capacitar os usuários a aproveitar efetivamente os recursos de IA, ao mesmo tempo em que reduz a dependência de tecnologias proprietárias.

Jeff Ding da ChinaAI traduziu o artigo bem divulgado do AItechtalk em por que Qwen é o modelo de código aberto mais popular do mundo atualmente, que escreveu que “de acordo com os dados do Hugging Face, a série/linhagem de modelos Qwen atingiu mais de 50.000. Ou seja, desenvolvedores ao redor do mundo treinaram mais de 50.000 modelos derivados com base na série Qwen, ficando atrás apenas da série Llama de cerca de 70.000. Esses dados são o indicador mais convincente para julgar a influência de um modelo no nível do ecossistema.”

Impressionantemente, os modelos Qwen atraíram interesse significativo de vários setores, incluindo automotivo, jogos e pesquisa científica no ano passado. Os modelos foram baixados mais de 40 milhões de vezes desde sua introdução. Além disso, o modelo leve Qwen-1.8B foi projetado para implantação em dispositivos de ponta, como smartphones, tornando-o uma opção atraente para aplicativos que exigem recursos computacionais mais baixos.

A atualização abrangente mais recente do Qwen2.5 significa uma escala de parâmetros maior, compreensão mais poderosa de fotos e vídeos, um modelo de linguagem de áudio em larga escala e modelos de código aberto contínuos. Não só foi melhorado drasticamente, mas o custo de fortes capacidades de inferência para dar suporte a tarefas complexas foi reduzido tanto para o Qwen-Plus quanto para o Qwen-Turbo. 

Olhando para o futuro, o CEO Eddie Wu observou que, embora o desenvolvimento da IA tenha progredido rapidamente, a AGI (Inteligência Geral Artificial) ainda está em seus estágios iniciais. Ele enfatizou a importância da colaboração e destacou que o custo de inferência de API para Tongyi Qianwen caiu em 97% ano a ano, um fator-chave que contribui para sua crescente popularidade. Na verdade, isso é verificado por Leo, o ex-executivo da Huawei que observou que os modelos Qwen oferecem maior precisão e factualidade em comparação com a maioria dos outros modelos baseados na China. Ele pode ser personalizado para casos de uso empresarial que priorizam a precisão das saídas e visam minimizar as alucinações do modelo além disso, A maior vantagem do Qwen atualmente é que ele está fornecendo aos desenvolvedores uma alternativa poderosa e econômica.

Como utilizar melhor o Qwen?

O Qwen se destaca como um modelo de linguagem grande (LLM) competitivo e comercialmente viável. Sua ampla adoção na comunidade de código aberto garante validação e suporte mais amplos, enquanto sua implantação é apoiada pela infraestrutura de classe mundial da Alibaba Cloud. Esses fatores fazem do Qwen uma escolha forte para empresas. Abaixo estão as quatro principais etapas para orientar sua implantação empresarial do Qwen.

  1. Definir objetivos de negócios e casos de uso: Foco em casos de uso de alto impacto, como automatização do suporte ao cliente, aprimoramento da análise de dados ou melhoria da geração de conteúdo.
  2. Preparação de dados e configuração de infraestrutura: Avalie e prepare os dados necessários para treinar e ajustar o modelo Qwen. Isso inclui limpar, estruturar e garantir a disponibilidade de conjuntos de dados relevantes, já que 60–70% do custo geral normalmente está nessa camada.
  3. Projeto Piloto e Avaliação Iterativa: Comece com um projeto piloto de pequena escala, compare os resultados com os KPIs predefinidos e repita rapidamente para obter melhorias.
  4. Ampliação e integração: Integre totalmente o Qwen aos seus fluxos de trabalho existentes para aproveitar todo o seu potencial, ao mesmo tempo em que estabelece uma estrutura de governança para monitorar e otimizar seu desempenho.

Nuvem Alibaba

A IA e o negócio da nuvem são como a mão esquerda e a mão direita, disse Joe Tsai.um podcast falando com o gestor de fundos de hedge norueguês Nicolai Tangen. Como mencionado anteriormente, qualquer um pode usar o LLM do Alibaba por meio de APIs ou ir diretamente para seu modelo de código aberto. No entanto, para qualquer um deles que queira implementar o Qwen, eles precisariam de poder de computação em nuvem e o Alibaba Cloud está lá para fornecer isso. 

Na verdade, atualmente, 80% das empresas de tecnologia da China e metade das grandes empresas modelo do país operam no Alibaba Cloud. Essa escala é simplesmente inigualável. Joe reiterou que com seu serviço de nuvem como o maior provedor na APAC, o Alibaba tem uma grande vantagem em reunir dados e testes para seu Tongyi Qianwen. O ciclo positivo permite que os dois negócios nas camadas de IA se alimentem continuamente.

Além disso, a empresa criou a maior comunidade de código aberto chamada Escopo do modelo que hospeda muitos outros modelos de código aberto no mercado e quando os desenvolvedores usam esses modelos de código aberto, eles também precisam de poder de computação, que se tornou o principal impulsionador da receita de nuvem do Alibaba.

Ao fornecer a infraestrutura de nuvem para as startups, a gigante da tecnologia espera proteger suas apostas permitindo que elas acessem o melhor aplicativo voltado para o consumidor em primeira mão. Fornecer a infraestrutura de nuvem permitiria que a empresa acessasse um conjunto diversificado de dados em todos os domínios e casos de uso, que ela poderia potencialmente alavancar para ajustar seus próprios modelos se tivesse permissão. Isso também significaria que a aquisição de talentos e a exposição a inovações no campo seriam mais acessíveis.

Aplicações de IA do Alibaba

Então, vamos dar uma olhada na frente de aplicação. O Alibaba integrou a IA em suas próprias operações extensivamente, utilizando-a para recomendações de produtos em sua plataforma de e-commerce, atendimento inteligente ao cliente, segmentação de anúncios com tecnologia de IA e soluções orientadas por IA em serviços de nuvem. Além disso, ele está procurando maneiras de usar melhor a IA para aumentar a eficiência logística e outros casos de uso também. Hoje, vamos dar uma olhada em alguns casos maduros primeiro.

O Serviço Online de Inteligência Artificial (AI OS) é uma plataforma desenvolvida pela equipe de engenharia de busca da empresa. O AI OS integra busca personalizada, recomendação e publicidade, dando suporte a vários cenários de negócios nas plataformas do Alibaba, com foco principalmente em aplicativos de mercado como o Taobao. A tecnologia originalmente focada nos recursos de busca do Taobao se expandiu para incluir tecnologias de aprendizado profundo e vários mecanismos de busca e recomendação. 

O Dingtalk é um software de bate-papo empresarial, semelhante ao Slack. No Dingtalk, todos os produtos foram habilitados para IA com um agente de IA incorporado para uso empresarial e pessoal, que foi lançado no início de 2024. O agente de IA é um robô virtual que pode examinar análises de dados e é equipado com recursos de memória, planejamento e execução. 

O formato para interagir com o agente é por meio de um chatbot semelhante ao ChatGPT. Os casos de uso sugeridos pela empresa incluem usar o robô como vendedor, TI, RH administrativo, financeiro ou equipe de compras e ele pode ajudar as empresas a automatizar muitas das tarefas repetitivas e tediosas dentro do processo de gerenciamento. 

Enquanto isso, a Alimama é uma plataforma que ajuda marcas com otimização de anúncios nos aplicativos de mercado de e-commerce da Alibaba – Tmall/ Taobao. A Alimama é uma unidade de negócios relativamente desconhecida da Alibaba, mas foi fundada bem no começo, em 2007. É uma plataforma de marketing digital para empresas que vendem nas plataformas Taobao ou Tmall. O LMA multimídia com tecnologia de IA foi lançado em abril deste ano e foi totalmente aplicado a aplicativos 2B agora. As ferramentas incluem agentes de vendas de IA capazes de lidar com consultas de clientes e executar tarefas básicas de design de anúncios para aumentar a eficiência e a qualidade. Além disso, a Alimama oferece análises de vendas para orçamento e preços, ferramentas de gerenciamento de estoque para aumentar o ROI e serviços de geração de texto para imagem ou vídeo com boa relação custo-benefício para anúncios. A empresa afirma ter atendido mais de 1 milhão de comerciantes na plataforma e reduzido significativamente os custos de produção de publicidade.

Investir para capturar todas as possibilidades (oportunidades)

O Alibaba adquiriu e investiu ativamente em várias empresas promissoras de IA em todas as camadas, particularmente aquelas especializadas em desenvolvimento de chips de IA e desenvolvedores de LLM. Esses movimentos estratégicos visam expandir as oportunidades do Alibaba no cenário de IA em rápida evolução.

E somente em 2024, o Alibaba liderou grandes rodadas de financiamento para diversas empresas de IA, incluindo um investimento de $1 bilhão na Moonshot AI, cuja avaliação disparou para aproximadamente $2,5 bilhões; uma rodada de financiamento de $691 milhões para a Baichuan, elevando sua avaliação para cerca de $2,8 bilhões; e um compromisso de > $600 milhões para a MiniMax, que é três dos quatro chamados "tigres".

Atualmente, as quatro startups de IA mais valiosas da China foram apelidadas de “Os Quatro (pequenos) Tigres da IA”, enquanto todas elas foram fundadas nos últimos três a cinco anos e já alcançaram um sucesso monumental com Moonshot será avaliado em $3 bilhões, Minimax avaliado em $2 bilhões, Jipu AI arrecada quase $800 milhões e Dizem que Baichuan está avaliada em cerca de $2 bilhões. 

Chips do Alibaba: T-Head

Por último, e muitas vezes esquecido, estão os esforços do Alibaba no desenvolvimento de hardware. Notícia de última hora, A Huawei não é a única grande empresa de tecnologia chinesa desenvolvendo hardware de chip. 

O empreendimento de chips da Alibaba, Cabeça em T, está fazendo avanços significativos no desenvolvimento da arquitetura RISC-V como parte do esforço mais amplo da China para a autossuficiência de semicondutores em meio às restrições comerciais em andamento nos EUA. A T-Head se concentrou na criação de chips de alto desempenho que podem suportar várias aplicações, incluindo inteligência artificial (IA), análise de big data e transações online.

Um dos produtos notáveis da T-Head é o Zhenyue 510, um chip controlador projetado para unidades de estado sólido (SSDs) empresariais. Lançado na conferência de computação em nuvem Apsara da Alibaba, este chip promete melhorar o desempenho nos data centers da Alibaba Cloud ao fornecer uma redução de 30% na latência para operações de entrada e saída em comparação com as soluções existentes. Esta inovação é crítica, pois permite que a Alibaba otimize seus serviços de nuvem e melhore a eficiência no manuseio de tarefas de processamento de dados em larga escala.

À medida que a China continua a lidar com as restrições à tecnologia dos EUA, o foco da T-Head no RISC-V representa um movimento estratégico em direção a uma potencial maior independência no design e na fabricação de chips. 

O que sabemos é que o Alibaba adotou uma abordagem holística para sua estratégia de IA. Ele abrange uma pilha de tecnologia abrangente e se posicionou como um participante-chave no ecossistema, que são todas as principais bases para impulsionar ainda mais os modelos Qwen significativamente. Construídos em uma base de escalabilidade em nível de infraestrutura, até o nível do chip, os modelos Qwen são projetados para dar suporte a diversos aplicativos em todo o amplo ecossistema de e-commerce, aplicativo e investimento do Alibaba. Esse foco estratégico não apenas aprimora as capacidades dos modelos, mas também garante sua relevância e eficácia em vários casos de uso orientados para empresas que priorizam a precisão e minimizam as alucinações do modelo. Ela se posicionou com sucesso como um dos participantes mais importantes, se não O MAIS IMPORTANTE, no ecossistema de IA da China.

##

Fontes: entrevistas, relatórios do setor, insights de especialistas, anúncios da empresa, material de relações com investidores, transcrições da Conferência Aspara e Alizila.

Ligações

  • Nuvem Alibaba link oficial para Qwen
  • Instruções Qwen2.5-LLM, última atualização em setembro de 2024
  • Github Qwen2.5: uma série de grandes modelos de linguagem que suportam uma variedade de escalas de parâmetros (de 0,5B a 72B), com capacidades melhoradas em geração de texto longo, acompanhamento de instruções e compreensão de dados estruturados, e suporta 29 idiomas. Seus aplicativos são adequados para geração de código, geração de texto e processamento de dados complexos. O Qwen2.5 oferece recursos como quantização, inferência e implantação local, que são compatíveis com várias estruturas computacionais, como Hugging Face, ModelScope e vLLM, entre outros.
  • Github Qwen-VL: é um modelo de linguagem visual em larga escala que suporta entradas de imagem e texto e tem capacidades de conversação multilíngue, destacando-se especialmente no reconhecimento de imagem-texto em chinês e inglês. O modelo suporta processamento de imagem de alta resolução e reconhecimento de granulação fina, superando a maioria dos modelos de código aberto.
  • Github Áudio Qwen: é capaz de processar várias entradas de áudio (como fala humana, sons naturais, música, etc.) e gerar saídas de texto. Este modelo é adequado para tarefas como reconhecimento de áudio, descrição de áudio, classificação de cena e reconhecimento de emoção.
  • Github Qwen2.5-Matemática: ele oferece suporte à solução de problemas matemáticos em chinês e inglês e integra a Cadeia de Pensamento (CoT) e o Raciocínio Integrado a Ferramentas (TIR).
  • Github Qwen2.5-Codificador: o mais recente modelo de programação de código aberto que suporta uma janela de contexto de 128K e abrange 92 linguagens de programação.

Biografia do autor

Grace escreve sobre IA x Energia, IA x Geopolítica, IA x bigtech em Substack na AI Proem.

Ela também escreve frequentemente comentários para Fortuna, O diplomata, e outras publicações internacionais sobre IA, tecnologia e governança corporativa. Em sua vida passada como jornalista, Grace relatou para a CNBC sobre tecnologia e negócios da Ásia de Cingapura, e seu trabalho também foi publicado no SCMP, S&P Global Market Intelligence, Yahoo Finance e USA Today. 

As 5 melhores leituras de Grace:

  1. A corrida armamentista da IA está longe de terminar: os chips são apenas metade do jogo, e a infraestrutura é a outra
  2. Por que os data centers não podem se tornar totalmente renováveis — ainda
  3. Lucros das grandes empresas de tecnologia: todos a postos para a IA
  4. Baidu, Alibaba, Tencent: confronto de IA
  5. Um Mundo Nuclear (Novo)

Próximo grande mergulho profundo: Huawei vs. Nvidia e Google

Postado por Graça Shao
POSTAGEM ANTERIOR
Você também pode gostar

Deixe seu comentário:

O seu endereço de email não será publicado. Campos obrigatórios marcados com *