Alors que nous entrons dans la troisième année de la révolution de l’IA générative, l’intelligence artificielle subit un changement radical. L’accent est mis sur la transition des réponses rapides et pré-entraînées (« penser vite ») vers une intelligence délibérée et raisonnée au moment de l’inférence (« penser lentement »). Cette évolution alimente une nouvelle génération d’applications agentiques, remodelant les industries et redéfinissant les possibilités.
La stabilisation de la couche de fondation de l'IA générative
Le marché de l'IA générative a atteint une phase de stabilisation cruciale. Des géants du secteur comme Microsoft/OpenAI, AWS/Anthropic, Meta et Google/DeepMind ont renforcé leurs positions au sein de la couche de fondation. Soutenus par des capitaux importants et des modèles économiques efficaces, ces partenariats ont rendu les prédictions du prochain jeton plus rapides, moins chères et plus accessibles.
Cependant, à mesure que la couche de fondation se stabilise, l'attention se porte sur la couche de raisonnement — le domaine de la résolution délibérée de problèmes et des opérations cognitives. Cette réflexion « Système 2 » va au-delà de la reconnaissance de formes, en se concentrant sur des modèles d’IA capables de raisonner et de prendre des décisions au moment de l’inférence. Inspirée par des avancées comme AlphaGo, cette couche transforme la façon dont l’IA résout les problèmes complexes du monde réel.
Du logiciel en tant que service (SaaS) au service en tant que logiciel
L'IA générative repousse les limites, nous faisant passer du modèle SaaS à un paradigme révolutionnaire : Le service en tant que logiciel. Ici, l'IA ne se contente pas de fournir des outils : elle effectue le travail elle-même. Ce changement ouvre une opportunité de marché d'un milliard de dollars, redéfinissant des secteurs comme le support client, la cybersécurité et le développement de logiciels.
Prendre Sierra, un agent de support client basé sur l'IA. Les entreprises ne paient plus pour les licences logicielles, mais pour chaque problème résolu. Cette approche axée sur les résultats incarne le Service-as-a-Software : fournir des résultats mesurables. De même, Copilote GitHub est passé de l'assistance aux développeurs à l'automatisation de flux de travail de codage entiers, et X-BOW révolutionne la cybersécurité grâce à des tests d'intrusion continus pilotés par l'IA.
Raisonnement au moment de l'inférence : la prochaine frontière
Le passage des réponses instinctives (« Système 1 ») au raisonnement délibéré (« Système 2 ») marque la prochaine étape transformatrice de l'IA. Des modèles comme celui d'OpenAI o1 (Fraise) sont les pionniers de cette évolution, en introduisant le « calcul au temps d'inférence » — permettant aux modèles de faire une pause, d'évaluer et de raisonner avant de répondre.
Cette innovation a déjà révolutionné des domaines comme le codage, les mathématiques et la recherche scientifique. Inspirées par le cadre de prise de décision révolutionnaire d'AlphaGo, ces avancées débloquent des capacités cognitives sans précédent, ouvrant la voie à l'IA pour relever des défis de plus en plus complexes.
Architectures cognitives : faire face à la complexité du monde réel
Alors que les modèles de raisonnement à usage général progressent, les applications du monde réel exigent architectures cognitives spécifiques à un domaineCes architectures imitent les flux de travail humains, en divisant les tâches en étapes discrètes et logiques.
Par exemple, Les droïdes de l'usine automatisez les tâches d'ingénierie logicielle telles que la révision des demandes d'extraction, l'exécution de tests et la fusion de code. En combinant des modèles de base avec une logique d'application, des garde-fous de conformité et des bases de données spécialisées, les architectures cognitives créent des solutions pratiques et intelligentes adaptées aux besoins de l'industrie.
Applications Agentic : redéfinir le marché
Les capacités de raisonnement de l'IA générative suscitent une vague de applications agentiques — Des outils d’IA qui prennent des initiatives et produisent des résultats tangibles. En voici quelques exemples :
- Harvey: Assistant juridique alimenté par l'IA
- Glaner:Assistant de travail IA
- Abréger:Scribe médical IA
- X-BOW: Testeur d'intrusion IA
- Sierra:Agent de support client IA
En réduisant le coût marginal de la fourniture de ces services, les applications agentiques rendent les outils sophistiqués accessibles aux entreprises de toutes tailles. Par exemple, les tests d'intrusion automatisés de XBOW démocratisent la cybersécurité, permettant aux entreprises de réaliser des évaluations régulières à moindre coût.
Mise à l'échelle du temps de calcul d'inférence : l'avenir de l'IA
Le prochain chapitre de l’innovation en matière d’IA dépend de la mise à l’échelle calcul au moment de l'inférenceLe modèle o1 d'OpenAI introduit une nouvelle loi d'échelle : plus le calcul alloué au moment de l'inférence est important, meilleures sont les capacités de raisonnement. Ce changement entraînera l'essor de Nuages d'inférence — des environnements dynamiques qui ajustent les ressources de calcul en fonction de la complexité des tâches.
Imaginez des modèles capables de raisonner pendant des heures ou des jours. Cette capacité pourrait conduire à des découvertes révolutionnaires en mathématiques, en biologie et dans d’autres domaines, résolvant des problèmes autrefois jugés insurmontables. La transition des clusters massifs de pré-formation aux nuages d’inférence agiles marque une étape importante dans le développement de l’IA.
Opportunités dans la couche applicative
Pour les startups et les investisseurs, la couche applicative offre les opportunités d'innovation les plus prometteuses. Alors que les hyperscalers dominent la couche de base, la couche applicative permet la création de solutions spécifiques à un domaine qui abordent les problèmes du monde réel avec précision.
En tirant parti d’architectures cognitives et de capacités de raisonnement personnalisées, les startups peuvent concevoir des outils qui s’intègrent parfaitement aux flux de travail, comblant ainsi le fossé entre les modèles à usage général et les applications pratiques.
Réflexions finales
L’IA transforme le monde à un rythme effréné, et elle modifie également le paysage économique, par exemple la manière dont les entreprises rivalisent et se développent. La raison en est que « les coûts de production pour fabriquer un produit ou un service, pour offrir une expérience client » sont infimes. Grâce à l’IA, le facteur « 10x » a été libéré.
Voici trois opinions personnelles sur l’avenir des entreprises et de l’IA, basées sur mes expériences de développement de GroundAI et de service à nos clients.
- Evolution de PLG vers ALG. Les SLG (sales-led growth) et PLG (product-led growth) traditionnelles ne sont plus aussi efficaces, étant donné que la base de clientèle ne s'est pas développée au même rythme que les gains de productivité. Par conséquent, la croissance penche fortement vers le réseau de distribution. une nouvelle approche pour atteindre votre public. Je l'ai appelé ALG, audience-led growth. L'essentiel est de savoir comment engager efficacement votre public sur différentes plateformes.
- L'accélération des entreprises technologiques chinoises s'aventurant à l'étranger, mais avec l'histoire de deux villes.
Les entreprises SaaS B2C ou B2B de masse ($20 ~ $100/mois), par exemple talkie.ai, runcomfy.com, prennent forme et se classent parmi les 3 premières dans leur domaine. Beaucoup de ces startups sont constituées d'une équipe de développement de moins de cinq personnes, mais alimentées par une approche SEO et ALG très sophistiquée. Par ailleurs, les grandes entreprises SaaS/Software (50 000 ~ 100 ACV) ont encore du mal à gagner des parts de marché, principalement en raison d'un problème que j'ai appelé « l'adéquation du fondateur au marché » - le fondateur ne peut pas localiser son état d'esprit pour créer un plan d'exécution cohérent pour atterrir et se développer en dehors de la Chine, mais beaucoup d'entre elles embauchent activement des talents étrangers avec des offres attractives, par exemple jusqu'à 350 000 USD/an - Changement de paradigme du logiciel en tant que service vers le « service en tant que logiciel ». Les capacités LLM progressent plus vite que prévu, par exemple la capacité de raisonnement d'O1 et O3 d'OpenAi. Cependant, le « dernier kilomètre » de la fourniture de ces capacités aux clients commerciaux n'est pas encore là. C'est pourquoi nous assistons à la prolifération des startups de services d'agents d'IA, mais malheureusement, elles ne résolvent que 20 à 30% des besoins commerciaux. C'est pourquoi la plupart des startups d'IA proposent des services ou gagnent de l'argent grâce au « service ». Re : mon article « Pourquoi les principaux SaaS d'IA facturent $20/mois.
L'IA générative redéfinit les limites des logiciels et des services, inaugurant une ère où l'IA effectue elle-même le travail. Alors que nous passons de Logiciel en tant que service à Service en tant que logiciel, le potentiel de transformation des industries et de création de nouveaux marchés est sans précédent. L'accent n'est plus mis sur l'imitation de l'intelligence humaine, mais sur le raisonnement, l'adaptation et la production de résultats qui remodèlent ce qui est possible.
La question n’est plus aujourd’hui de savoir si l’IA peut évoluer, mais de savoir comment elle va redéfinir notre façon de travailler, d’innover et de résoudre les problèmes les plus complexes du monde.
Abonnez-vous pour recevoir les dernières mises à jour du blog
Laissez votre commentaire: