Malgré l'interdiction des puces électroniques aux États-Unis, l'écosystème de l'IA en Chine a dépassé les attentes, attirant notamment l'attention internationale des développeurs, car la série Qwen open source d'Alibaba a été largement adoptée et discutée dans la communauté

La Chine a créé un écosystème d’IA complètement distinct pour diverses raisons : 1) pour réduire sa dépendance à l’égard de l’Occident et 2) les contraintes de censure du Grand Pare-feu ; mais cela ne veut pas dire que l’innovation est étouffée.

Il existe actuellement en Chine un ensemble d’acteurs extrêmement dynamiques dans l’écosystème de l’IA, et aujourd’hui nous allons plonger en profondeur dans le rôle joué par Alibaba dans cet espace.

EntrepriseCouche d'infrastructureCouche de modèleCouche d'application
AlibabaAlibaba Cloud propose une infrastructure cloud robuste avec prise en charge de modèles open source et de services d'IA étendus.Qwen-72B et Qwen-1.8B sont des LLM avancés développés par Alibaba Cloud, avec des capacités de traitement multimodal.Dingtalk, plateforme de chat d'entreprise Alimama, ensemble d'outils d'optimisation publicitaire pilotés par l'IA pour les PME vendant sur Tmall et Taobao.
TencentTencent améliore ses capacités d'IA grâce à son réseau intelligent haute performance, optimisant l'utilisation du GPU pour la formation LLM.Hunyuan est le LLM interne de Tencent destiné aux applications d'entreprise, en mettant l'accent sur l'efficacité et la rentabilité.Les services d’IA de Tencent incluent des flux d'actualités personnalisés et des solutions de chatbot sur ses applications existantes.
HuaweiHuawei Cloud fournit une infrastructure haute performance adaptée aux applications d'IA, en mettant l'accent sur l'autonomie technologique.Pangu 3.0 se compose de modèles fondamentaux, spécifiques à l'industrie et à des scénarios, conçus pour diverses applications dans tous les secteurs.Les LLM de Huawei sont utilisés dans divers secteurs tels que la finance et la santé pour améliorer les efforts de transformation numérique.
ByteDanceByteDance s'appuie sur son infrastructure cloud pour soutenir le déploiement de ses LLM, en mettant l'accent sur la rentabilité des services d'IA.Doubao est une famille de LLM lancée par ByteDance, conçue pour diverses applications avec des stratégies de prix agressives.Des applications comme Doubao Chatbot et d’autres outils d’IA génératifs visent à améliorer l’interaction des utilisateurs et la génération de contenu.
BaiduBaidu Cloud fournit une infrastructure complète pour la formation et le déploiement de modèles d'IA, en se concentrant sur les avancées technologiques de l'IA.Ernie est le LLM phare de Baidu qui a connu des améliorations significatives en termes d'efficacité de la formation et de performances des applications au fil du temps.Les applications de Baidu utilisent Ernie pour des capacités de recherche améliorées, des agents conversationnels et d'autres solutions basées sur l'IA.

Joe Tsai parle de la stratégie d'IA d'Alibaba, en se concentrant sur le soutien de l'infrastructure d'IA en tirant parti de son activité cloud existante.

Le manuel d'Alibaba sur l'IA

Alibaba investit dans l’IA de cinq manières principales avec une double stratégie.

Stratégie de pile technologique de bout en bout :

  1. Création d'un LLM propriétaire – Qwen et offre ses LLM aux développeurs d'IA  
  2. Service de cloud computing
  3. Conception de puces adaptées au traitement des applications d'IA.

Stratégie écosystémique:

  1. Implémenter l'IA dans ses applications existantes destinées aux consommateurs 
  2. Financer les entreprises d'IA dans l'ensemble de l'écosystème 

Alibaba est sans conteste l'entreprise technologique chinoise la plus connue à l'échelle internationale, avec une activité cloud de premier plan et sa propre technologie LLM. Bien qu'en Chine, Baidu et Huawei disposent chacun de leurs propres modèles et services cloud, la stratégie axée sur les données de Baidu a toujours été davantage axée sur sa technologie de conduite autonome et Huawei a toujours été davantage axée sur le calcul et le matériel, tandis que son LLM est davantage considéré comme un « plus » pour les clients d'entreprise. 

En revanche, Alibaba a déclaré à plusieurs reprises que son objectif était de « rendre l’IA accessible à tous ». Lors de la conférence Apsara 2024, Le PDG d'Alibaba, Eddie Wu, a souligné que la société s'engage à soutenir l'écosystème open source, des puces, des serveurs et des réseaux, jusqu'au stockage et aux centres de données. 

LLM propriétaire : Tongyi Qianwen (Qwen)

Au premier plan des offres d'IA d'Alibaba se trouve Tongyi Qianwen, un modèle de langage de grande taille apparenté à un « super chatbot ». Ce modèle avancé est capable de comprendre et de générer du texte, ce qui le rend adapté à un large éventail d'applications, notamment la génération d'articles, les réponses conversationnelles et le support client. 

La série Qwen est dotée d'une évolutivité incroyable, de performances sur tous les tests, de fonctionnalités multimodales et d'un engagement en faveur de l'accessibilité pour un large éventail d'utilisateurs. Alibaba a rendu cette technologie accessible au public, permettant à d'autres entreprises de l'utiliser gratuitement pour améliorer leurs capacités de service client.

« C'est le LLM chinois le plus compétitif par rapport à des programmes comme GPT4/4.o en termes de performances globales », a déclaré Leo Jiang, fondateur de GroundAI et ancien directeur numérique de Huawei. 

Il a ajouté que ce qui rend Qwen spécial est dû à ses deux formats : « son service LLM basé sur API offre un délai de mise sur le marché plus rapide et une rentabilité accrue. Tandis que sa version open source offre plus de contrôle et de confidentialité à ses clients. »

Alibaba a lancé en 2023 son outil de développement linguistique Tongyi Qianwen, souvent appelé Qwen, qui en est aujourd'hui à sa 2,5e itération. Les modèles Qwen, notamment Qwen-72B et Qwen-1.8B, se distinguent par la diversité de leurs tailles de paramètres, allant de 1,8 à 72 milliards de paramètres, et par leurs capacités multimodales, qui leur permettent de traiter non seulement du texte, mais aussi des données audio et visuelles.

Cette flexibilité est renforcée par leur formation sur plus de 3 000 milliards de jetons, ce qui leur permet de surpasser de nombreux autres modèles open source sur divers critères de référence, notamment la précision multitâche et les capacités de génération de code.

Qwen s'est positionné comme un assistant IA complet, avec cinq cas d'utilisation d'application clés : 

1) transcription et résumés de réunions en temps réel 

2) traiter des contenus longs et fournir des résumés qui nécessitent une compréhension complexe 

3) Création de présentations PowerPoint par l'IA 

4) traduction simultanée en temps réel

5) Chat vidéo avec un agent IA capable de résoudre les problèmes.

Source : Alibaba

La particularité de Qwen réside dans sa technologie impressionnante et son engagement fort envers les principes open source, car Alibaba met à disposition différentes versions de ses modèles sur des plateformes comme Hugging Face et ModelScope. Certains se demandent pourquoi l'entreprise a choisi d'ouvrir son modèle à d'autres, alors qu'elle a investi des capitaux dans l'IA et qu'elle distribue désormais ses récompenses gratuitement. Cependant, l'entreprise a insisté sur le fait qu'elle voulait le rendre accessible à tous, soulignant que cette approche favorise un environnement collaboratif dans lequel les développeurs peuvent expérimenter et innover ensemble. La monétisation peut venir plus tard et Alibaba trouvera sûrement des moyens de le faire, mais pour l'instant, elle s'est imposée comme un acteur clé de la démocratisation de l'accès aux technologies avancées de l'IA pour tous. 

Alibaba a principalement formé ses modèles d’IA open source à partir de données accessibles au public dans ses applications, comme son application de marché en ligne Taobao, un avantage concurrentiel considérable étant donné que le nombre d’utilisateurs actifs mensuels dépasse les 930 millions. En ouvrant ses modèles propriétaires, l’entreprise a suscité un débat sur la question de savoir si les modèles d’IA open source, généralement plus transparents et plus rentables, sont également plus susceptibles d’être utilisés à mauvais escient. 

En particulier, les entreprises comptant moins de 100 millions d’utilisateurs actifs par mois peuvent utiliser ces modèles gratuitement, favorisant ainsi une adoption plus large dans tous les secteurs. En soutenant la croissance de la communauté open source, Alibaba a pour objectif de permettre aux utilisateurs d’exploiter efficacement les capacités de l’IA tout en réduisant leur dépendance aux technologies propriétaires.

Jeff Ding de ChinaAI traduit l'article AItechtalk bien diffusé sur pourquoi Qwen est actuellement le grand modèle open source le plus populaire au monde, Selon les données de Hugging Face, la série/lignée de modèles Qwen a atteint plus de 50 000. Autrement dit, les développeurs du monde entier ont formé plus de 50 000 modèles dérivés basés sur la base de la série Qwen, ce qui n’est dépassé que par la série Llama, qui compte environ 70 000 modèles. Ces données constituent l’indicateur le plus convaincant pour juger de l’influence d’un modèle au niveau de l’écosystème.

Les modèles Qwen ont suscité un intérêt considérable dans de nombreux secteurs, notamment l’automobile, les jeux et la recherche scientifique l’année dernière. Les modèles ont été téléchargés plus de 40 millions de fois depuis leur lancement. De plus, le modèle léger Qwen-1.8B est conçu pour être déployé sur des appareils de pointe tels que les smartphones, ce qui en fait une option intéressante pour les applications nécessitant moins de ressources de calcul.

La dernière mise à niveau complète de Qwen2.5 signifie une échelle de paramètres plus large, une compréhension plus puissante des photos et des vidéos, un modèle de langage audio à grande échelle et des modèles open source continus. Non seulement il a été considérablement amélioré, mais le coût des capacités d'inférence solides pour prendre en charge des tâches complexes a été réduit pour Qwen-Plus et Qwen-Turbo. 

En regardant vers l'avenir, le PDG Eddie Wu a noté que si le développement de l'IA a progressé rapidement, l'AGI (intelligence artificielle générale) en est encore à ses débuts. Il a souligné l'importance de la collaboration et a souligné que le coût d'inférence de l'API pour Tongyi Qianwen a diminué de 97% d'une année sur l'autre, un facteur clé contribuant à sa popularité croissante. En fait, cela est vérifié par Leo, l'ancien dirigeant de Huawei qui a noté que les modèles Qwen offrent une précision et une factualité supérieures à la plupart des autres modèles basés en Chine. Il peut être personnalisé pour les cas d'utilisation d'entreprise qui privilégient la précision des résultats et visent à minimiser les hallucinations du modèle en outre, Le principal avantage de Qwen à l’heure actuelle est qu’il offre aux développeurs une alternative puissante mais rentable.

Comment utiliser au mieux Qwen ?

Qwen se distingue par sa compétitivité et sa viabilité commerciale. Son adoption généralisée au sein de la communauté open source garantit une validation et un support plus larges, tandis que son déploiement s'appuie sur l'infrastructure de classe mondiale d'Alibaba Cloud. Ces facteurs font de Qwen un choix judicieux pour les entreprises. Vous trouverez ci-dessous les quatre étapes clés pour guider votre déploiement d'entreprise Qwen.

  1. Définir les objectifs commerciaux et les cas d'utilisation:Concentrez-vous sur les cas d’utilisation à fort impact, tels que l’automatisation du support client, l’amélioration de l’analyse des données ou l’amélioration de la génération de contenu.
  2. Préparation des données et configuration de l'infrastructure:Évaluer et préparer les données nécessaires à la formation et au réglage fin du modèle Qwen. Cela comprend le nettoyage, la structuration et la garantie de la disponibilité des ensembles de données pertinents, car 60 à 70% du coût global se situe généralement dans cette couche.
  3. Projet pilote et évaluation itérative : Commencez par un projet pilote à petite échelle, comparez les résultats aux indicateurs de performance clés prédéfinis et procédez rapidement à des itérations pour apporter des améliorations.
  4. Mise à l’échelle et intégration : Intégrez entièrement Qwen dans vos flux de travail existants pour exploiter tout son potentiel, tout en établissant une structure de gouvernance pour surveiller et optimiser ses performances.

Nuage Alibaba

L'IA et le cloud sont comme la main gauche et la main droite, a déclaré Joe TsaiDans un podcast, nous discutons avec le gestionnaire de fonds spéculatifs norvégien Nicolai Tangen. Comme mentionné précédemment, tout le monde peut utiliser le LLM d'Alibaba via des API ou accéder directement à son modèle open source. Cependant, pour ceux qui souhaitent déployer Qwen, ils auront besoin de la puissance du cloud computing et Alibaba Cloud est là pour le leur fournir. 

En fait, à l'heure actuelle, 801 entreprises technologiques chinoises et la moitié des grandes entreprises du pays utilisent Alibaba Cloud. Cette échelle est tout simplement incomparable. Joe a réitéré qu'avec son service cloud en tant que plus grand fournisseur de la région Asie-Pacifique, Alibaba dispose d'un énorme avantage pour recueillir des données et effectuer des essais pour son Tongyi Qianwen. Le cycle positif permet aux deux entreprises à travers les couches d'IA de s'alimenter en permanence.

De plus, l'entreprise a créé la plus grande communauté open source appelée Portée du modèle qui héberge de nombreux autres modèles open source sur le marché et lorsque les développeurs utilisent ces modèles open source, ils auront également besoin de puissance de calcul, qui est devenue l'un des principaux moteurs des revenus du cloud d'Alibaba.

En fournissant l’infrastructure cloud aux startups, le géant de la technologie espère couvrir ses paris en leur permettant d’accéder directement à la meilleure application destinée aux consommateurs. La fourniture de l’infrastructure cloud permettrait à l’entreprise d’accéder à un pool diversifié de données dans différents domaines et cas d’utilisation, qu’elle pourrait potentiellement exploiter pour affiner ses propres modèles si elle en avait l’autorisation. Cela signifierait également que l’acquisition de talents et l’exposition aux innovations dans le domaine seraient plus accessibles.

Les applications d'IA d'Alibaba

Examinons maintenant le côté applicatif. Alibaba a largement intégré l'IA dans ses propres opérations, l'utilisant pour les recommandations de produits sur sa plateforme de commerce électronique, le service client intelligent, le ciblage publicitaire basé sur l'IA et les solutions basées sur l'IA dans les services cloud. En outre, l'entreprise cherche des moyens de mieux utiliser l'IA pour améliorer l'efficacité logistique et d'autres cas d'utilisation. Aujourd'hui, examinons d'abord quelques-unes des applications les plus avancées.

Le service en ligne d'intelligence artificielle (AI OS) est une plateforme développée par l'équipe d'ingénierie de recherche de l'entreprise. AI OS intègre la recherche personnalisée, la recommandation et la publicité, prenant en charge divers scénarios commerciaux sur les plateformes d'Alibaba, principalement axés sur les applications de marché telles que Taobao. La technologie initialement axée sur les capacités de recherche de Taobao s'est étendue pour inclure des technologies d'apprentissage profond et divers moteurs de recherche et de recommandation. 

Dingtalk est un logiciel de chat d'entreprise, similaire à Slack. Dans Dingtalk, tous les produits sont dotés d'un agent IA intégré pour une utilisation professionnelle et personnelle, lancé début 2024. L'agent IA est un robot virtuel capable d'examiner les analyses de données et doté de capacités de mémoire, de planification et d'exécution. 

Le format d'interaction avec l'agent se fait via un chatbot similaire à ChatGPT. Les cas d'utilisation suggérés par l'entreprise incluent l'utilisation du robot en tant que vendeur, personnel informatique, administratif RH, financier ou d'approvisionnement et il peut aider les entreprises à automatiser de nombreuses tâches répétitives et fastidieuses au sein du processus de gestion. 

Alimama est une plateforme qui aide les marques à optimiser leurs publicités sur les applications de la place de marché de commerce électronique d'Alibaba, Tmall/Taobao. Alimama est une unité commerciale relativement inconnue d'Alibaba, mais elle a en fait été fondée très tôt en 2007. Il s'agit d'une plateforme de marketing numérique destinée aux entreprises qui vendent sur les plateformes Taobao ou Tmall. Le LMA multimédia basé sur l'IA a été lancé en avril de cette année et est désormais entièrement appliqué à 2B applications. Les outils comprennent des agents commerciaux IA capables de gérer les demandes des clients et d'effectuer des tâches de conception publicitaire de base pour améliorer l'efficacité et la qualité. De plus, Alimama propose des analyses des ventes pour la budgétisation et la tarification, des outils de gestion des stocks pour augmenter le retour sur investissement et des services rentables de génération de texte en image ou de vidéo pour les publicités. La société affirme avoir servi plus d'un million de commerçants sur la plateforme et avoir considérablement réduit les coûts de production publicitaire.

Investir pour saisir toutes les possibilités (opportunités)

Alibaba a activement acquis et investi dans plusieurs entreprises prometteuses dans le domaine de l'IA, notamment celles spécialisées dans le développement de puces IA et les développeurs LLM. Ces initiatives stratégiques visent à élargir les opportunités d'Alibaba dans un paysage de l'IA en évolution rapide.

Et rien qu'en 2024, Alibaba a mené des cycles de financement majeurs pour plusieurs entreprises d'IA, notamment un investissement de 14,1 milliards de livres sterling dans Moonshot AI, dont la valorisation a grimpé à environ 2,5 milliards de livres sterling ; un cycle de financement de 14,691 millions de livres sterling pour Baichuan, portant sa valorisation à environ 2,8 milliards de livres sterling ; et un engagement de plus de 14,600 millions de livres sterling pour MiniMax, qui représente trois des quatre « tigres ».

Actuellement, les quatre startups d’IA les plus précieuses en Chine ont été surnommées « Les quatre (petits) tigres de l’IA », alors qu’elles ont toutes été fondées au cours des trois à cinq dernières années et ont déjà connu un succès monumental. Moonshot sera valorisé à 1443 milliards de TP, Minimax est valorisée à 1 milliard TP4T2, Zhipu L'IA lève près de 14800 millions de TP4T et Baichuan serait valorisée à près de 14,2 milliards de TP. 

Les chips d'Alibaba : T-Head

Enfin, et souvent négligé, les efforts d'Alibaba dans le développement de matériel informatique. Flash info, Huawei n’est pas la seule grande entreprise technologique chinoise à développer du matériel de puces. 

L'entreprise de puces électroniques d'Alibaba, Tête en T, fait des progrès significatifs dans le développement de l'architecture RISC-V dans le cadre de l'effort plus large de la Chine pour l'autosuffisance en semi-conducteurs dans un contexte de restrictions commerciales continues des États-Unis. T-Head s'est concentré sur la création de puces hautes performances capables de prendre en charge diverses applications, notamment l'intelligence artificielle (IA), l'analyse de big data et les transactions en ligne.

L'un des produits phares de T-Head est le Zhenyue 510, une puce de contrôleur conçue pour les disques SSD d'entreprise. Lancée lors de la conférence Apsara d'Alibaba sur le cloud computing, cette puce promet d'améliorer les performances des centres de données d'Alibaba Cloud en offrant une réduction de 30% de la latence pour les opérations d'entrée et de sortie par rapport aux solutions existantes. Cette innovation est essentielle car elle permet à Alibaba d'optimiser ses services cloud et d'améliorer l'efficacité dans la gestion des tâches de traitement de données à grande échelle.

Alors que la Chine continue de faire face aux restrictions imposées à la technologie américaine, l'accent mis par T-Head sur RISC-V représente une évolution stratégique vers une plus grande indépendance potentielle dans la conception et la fabrication de puces. 

Ce que nous savons, c'est qu'Alibaba a adopté une approche holistique de sa stratégie d'IA. Elle englobe une pile technologique complète et s'est positionnée comme un acteur clé de l'écosystème, autant de fondements essentiels pour propulser encore plus considérablement les modèles Qwen. Construits sur une base d'évolutivité au niveau de l'infrastructure, jusqu'au niveau de la puce, les modèles Qwen sont conçus pour prendre en charge diverses applications dans le vaste écosystème de commerce électronique, d'applications et d'investissement d'Alibaba. Cette orientation stratégique améliore non seulement les capacités des modèles, mais garantit également leur pertinence et leur efficacité dans divers cas d'utilisation axés sur l'entreprise qui privilégient la précision et minimisent les hallucinations du modèle. Elle a réussi à se positionner comme l’un des acteurs les plus importants, voire LE PLUS IMPORTANT, de l’écosystème de l’IA en Chine.

##

Sources : entretiens, rapports sectoriels, avis d'experts, annonces d'entreprises, documents de relations avec les investisseurs, transcriptions de la conférence Aspara et Alizila.

Links

  • Nuage Alibaba lien officiel vers Qwen
  • Instructions pour Qwen2.5-LLM, dernière mise à jour en septembre 2024
  • Github Qwen2.5: une série de grands modèles de langage prenant en charge une variété d'échelles de paramètres (de 0,5 B à 72 B), avec des capacités améliorées de génération de texte long, de suivi d'instructions et de compréhension de données structurées, et prenant en charge 29 langues. Ses applications sont adaptées à la génération de code, à la génération de texte et au traitement de données complexes. Qwen2.5 offre des fonctionnalités telles que la quantification, l'inférence et le déploiement local, qui sont compatibles avec divers cadres de calcul, tels que Hugging Face, ModelScope et vLLM, entre autres.
  • Github Qwen-VL: est un modèle de langage visuel à grande échelle qui prend en charge les entrées d'images et de texte et dispose de capacités de conversation multilingue, excellant notamment dans la reconnaissance d'images et de textes en chinois et en anglais. Le modèle prend en charge le traitement d'images haute résolution et la reconnaissance fine, surpassant la plupart des modèles open source.
  • Github Qwen Audio: est capable de traiter diverses entrées audio (comme la parole humaine, les sons naturels, la musique, etc.) et de générer des sorties de texte. Ce modèle est adapté à des tâches telles que la reconnaissance audio, la description audio, la classification de scènes et la reconnaissance des émotions.
  • Github Qwen2.5-Mathématiques:il prend en charge la résolution de problèmes mathématiques en chinois et en anglais et intègre la chaîne de pensée (CoT) et le raisonnement intégré aux outils (TIR).
  • Github Codeur Qwen2.5: le dernier modèle de programmation open source qui prend en charge une fenêtre de contexte de 128 K et couvre 92 langages de programmation.

Biographie de l'auteur

Grace écrit sur l'IA x l'énergie, l'IA x la géopolitique, l'IA x les grandes technologies sur Substack chez AI Proem.

Elle écrit également souvent des commentaires pour Fortune, Le Diplomate, et d'autres publications internationales sur l'IA, la technologie et la gouvernance d'entreprise. Dans sa vie antérieure de journaliste, Grace a réalisé des reportages pour CNBC sur la technologie et les affaires en Asie depuis Singapour, et son travail a également été publié dans le SCMP, S&P Global Market Intelligence, Yahoo Finance et USA Today. 

Top 5 des lectures de Grace :

  1. La course aux armements de l’IA est loin d’être terminée : les puces ne représentent que la moitié du jeu, et l’infrastructure est l’autre
  2. Pourquoi les centres de données ne peuvent pas encore être entièrement alimentés par des énergies renouvelables
  3. Bénéfices des grandes entreprises technologiques : tout le monde sur le pont pour l'IA
  4. Baidu, Alibaba, Tencent : la confrontation entre l'IA et les robots
  5. Un tout nouveau monde nucléaire

Prochaine grande immersion à venir : Huawei contre Nvidia et Google

Publié par Grace Shao
ARTICLE PRÉCÉDENT
Vous aimerez peut-être aussi

Laissez votre commentaire:

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *