L'activité de recherche de Google est enfin face à un véritable concurrent.

Une nouvelle société de recherche d'IA nommée Perplexity, axée sur la création et l'expansion des connaissances, a atteint 10 millions d'utilisateurs actifs mensuels (MAU) début 2024, enregistrant un taux de croissance mensuel stupéfiant de plus de 40%.

Au moment de la rédaction de cet article, son MAU pouvait se situer entre 40 et 50 millions. Comparé au MAU de recherche Google, il est encore minuscule. Cependant, ce qui est vraiment prometteur, c'est la nouvelle expérience de recherche qu'il offre. Il ne se concentre pas uniquement sur ce que vous savez, par exemple en renvoyant des résultats basés sur une recherche par mot-clé, mais il élargit également vos connaissances lorsque vous ne savez pas exactement quoi rechercher, par exemple si vous ne connaissez pas le mot-clé à rechercher. 

Cela est alimenté par la recherche hybride. 

Qu'est-ce que la recherche hybride ?

La recherche hybride est une technique de recherche avancée qui combine les atouts de la recherche par mots-clés traditionnelle (basée sur les mots-clés) avec les capacités de recherche sémantique modernes (basées sur l'intention). 

Les résultats des moteurs de recherche dépendent principalement de la correspondance des mots clés. Par exemple, si vous recherchez les meilleurs smartphones avec des caméras haute définition, la recherche par mot clé traditionnelle n'affiche que les résultats avec les mots clés « smartphones » et « caméra haute définition », mais vous risquez de manquer des informations telles que ses avis, ses comparaisons et d'autres informations spécifiques au contexte telles que les performances en basse lumière, les capacités vidéo et plus encore.

La recherche sémantique comprend vos intentions d'achat d'un smartphone, mais vous pouvez obtenir des résultats plus précis et un ensemble complet de résultats en combinant la recherche par mot-clé et la recherche sémantique. Et c'est ce qu'est la recherche hybride.

Pourquoi la recherche hybride est-elle importante en 2024 ?

Saviez-vous que même les plus grandes entreprises de commerce électronique comme Amazon et eBay utilisent des algorithmes de recherche hybrides pour de meilleures recommandations et une expérience améliorée ? Du côté des startups, elles évoluent encore plus vite. Par exemple, la startup britannique Moonsift exploite la recherche hybride pour aider les acheteurs en ligne à découvrir les produits qu'ils aiment. Tamisage lunaire propose une extension de navigateur de commerce électronique permettant aux utilisateurs de sélectionner des tableaux achetables avec des produits provenant de partout sur Internet, ce qui est essentiel pour fournir aux utilisateurs les résultats ou services précis qu'ils souhaitent. 

Offrir aux utilisateurs une expérience parfaite et leur permettre de se sentir compris est essentiel, et c'est pourquoi la recherche hybride est importante en 2024. 

Les meilleures solutions de recherche hybride en 2024

Il existe de nombreux outils de recherche hybrides disponibles sur le marché. Ci-dessous, nous avons étudié les trois principaux solutions de recherche hybrides que vous trouverez intéressant à découvrir.

#1 Pomme de pin

La plateforme Pinecone est une base de données vectorielles basée sur le cloud conçue pour les applications de recherche. Elle combine la recherche vectorielle avec des mots-clés et des filtres de métadonnées familiers pour obtenir les résultats les plus récents et les plus pertinents. Elle offre une interface API utilisateur pour les capacités de recherche sémantique et multimodale ainsi que des services de génération de candidats. La création de solutions d'IA est simplifiée grâce à son infrastructure sans tracas. 

Caractéristiques principales de Pinecone

  • Solution tout-en-un : Combine la recherche par mots-clés et sémantique dans un seul système, simplifiant ainsi la mise en œuvre et la gestion.
  • Pertinence personnalisable : Ajustez facilement l’équilibre entre les correspondances exactes et les concepts associés en fonction des besoins de votre entreprise.
  • Application polyvalente : Fonctionne sur différents types de contenu, notamment du texte, des images et de l'audio, ce qui le rend adapté à divers cas d'utilisation professionnelle.
  • Évolutivité : Gère efficacement de grands volumes de données et évolue avec votre entreprise sans problèmes de performances.
  • Convivial: S'intègre parfaitement aux systèmes existants via une API simple, réduisant ainsi la complexité technique.
  • Précision améliorée : Améliore la précision de la recherche en prenant en compte à la fois des termes spécifiques et le contexte global, ce qui conduit à de meilleures expériences utilisateur.
  • Rentable : Élimine le besoin de multiples solutions de recherche, réduisant ainsi potentiellement les coûts opérationnels et la complexité.
  • Adaptable: Prend en charge divers modèles de recherche standard du secteur, permettant une flexibilité de mise en œuvre en fonction des exigences commerciales spécifiques.

Cas d'utilisation :

Pinecone est utile pour fournir des recommandations personnalisées, une similarité de recherche en temps réel et créer des applications d'IA qui nécessitent des capacités de recherche rapides et précises. Voici quelques cas d'utilisation de Pinecones : 

  • Recherche de produits de commerce électronique : Améliorer la découverte et la pertinence des produits.
  • Réponses aux questions du domaine ouvert : Améliorer la précision des requêtes de connaissances générales.
  • Chatbots contextuels : Fournir des réponses plus pertinentes dans l'IA conversationnelle.
  • Expériences de recherche personnalisées : Personnalisation des résultats en fonction des préférences et du comportement des utilisateurs.
  • Génération Augmentée de Récupération (RAG) : Améliorer les résultats du modèle linguistique avec une recherche d'informations pertinentes.
  • Recherche d'entreprise : Améliorer la recherche d’informations à travers diverses données d’entreprise.
  • Systèmes de recommandation de contenu : Suggérer du contenu pertinent aux utilisateurs.

Étude de cas :

Explorons l'étude de cas de la manière dont Pinecone a contribué au succès d'Entrapeer.

Défis : Entrapeer est une plateforme avec plus de 200 000 cas d'utilisation et plus de 3 millions de profils de startups. Elle avait du mal à traiter des volumes de données importants. Il était difficile pour les utilisateurs d'obtenir des informations rapides et de naviguer dans des ensembles de données très sophistiqués. Le processus d'exploration était chronophage et inefficace, ce qui avait une influence négative sur la prise de décision. 

Solution: Ils ont mis en œuvre la technologie de base de données vectorielles de Pinecone pour faciliter l'accès aux données. En utilisant des intégrations, Pinecone a simplifié le traitement de données massives et a fourni des informations plus rapides.

Le résultat obtenu : Devinez quoi, la mise en œuvre de Pinecone s'est avérée positive à plusieurs égards. Tout d'abord, la plateforme a commencé à traiter des milliers de cas d'utilisation et a reçu des millions de profils de startups. Cela se faisait manuellement auparavant, donc le résultat était choquant dans le contexte de la réduction des frais généraux de traitement de 99%. 

D'autres points positifs ont été la navigation rapide des clients dans les ensembles de données et la prise de décision très efficace qui a permis à la plateforme de rester leader sur le marché.

Lien vers le site officiel : https://www.pinecone.io/

#2 Tissage

Weaviate est un fournisseur de bases de données vectorielles open source et propose la recherche hybride comme l'une de ses fonctionnalités clés. L'équipe s'est rapidement développée pour compter plus de 80 employés et servir à la fois les startups et les entreprises.  

La recherche hybride de Weaviate utilise à la fois des vecteurs clairsemés (pour la recherche par mots-clés) et des vecteurs denses (pour la recherche sémantique) pour représenter la signification et le contexte des requêtes de recherche et des documents.

Principales caractéristiques de Weaviate :

  • Combine plusieurs algorithmes de recherche pour une précision et une pertinence améliorées
  • Boucles de rétroaction génératives : Prendre les résultats générés à partir des modèles, les vectoriser et les enregistrer dans la base de données pour une utilisation ultérieure. Cela crée un cycle de génération, de stockage et de récupération de données qui peut améliorer les capacités des applications d'IA
  • Traitement en temps réel : Possibilité de rechercher et de mettre à jour des données en temps réel, même pendant que les données sont importées ou modifiées
  • Architecture rentable : Équilibrage stratégique entre vitesse et coût, avec la possibilité de gérer de grands ensembles de données sans tout conserver en mémoire
  • Flexibilité: Prend en charge divers langages de programmation et requêtes GraphQL
  • Évolutivité : Conçu pour évoluer horizontalement afin de gérer de grands ensembles de données et des volumes de requêtes élevés
  • Multimodal : Capable de gérer plusieurs types de données, notamment du texte, des images, etc., ce qui le rend polyvalent pour diverses applications
  • Intégration du modèle d’IA : S'intègre parfaitement à divers modèles d'IA et d'apprentissage automatique

Cas d'utilisation :

Weaviate est particulièrement adapté aux applications qui nécessitent une compréhension contextuelle, comme les chatbots ou les moteurs de recherche basés sur l'IA. Voici quelques exemples d'utilisation de Weaviate :

  1. Recherche de produits de commerce électronique :
    • Améliore la découverte de produits en combinant des correspondances de mots clés exactes avec des éléments sémantiquement liés
    • Améliore l'expérience utilisateur et augmente potentiellement les taux de conversion
  2. Systèmes de recommandation de contenu :
    • Fournit des suggestions de contenu plus pertinentes en comprenant à la fois les termes spécifiques et le contexte global
    • Augmente l'engagement des utilisateurs et le temps passé sur la plateforme
  3. Systèmes de gestion des connaissances :
    • Facilite une recherche d'informations plus efficace dans les environnements d'entreprise
    • Améliore la productivité des employés en fournissant des résultats de recherche plus précis

Étude de cas :

Défis: Instabase est une plateforme d'application d'IA de niveau entreprise, qui traite plus de 500 000 documents par jour. Le défi était assez évident : il s'agissait de traiter et de comprendre les documents, car elle traite chaque jour de vastes données. Ils ont choisi Weaviate en raison de la flexibilité que leur offrait un outil open source de premier plan tout en atteignant les indicateurs de performance critiques d'Instabase mieux que toute autre base de données qu'ils ont testée.

Solution:Instabase utilise Weaviate pour alimenter sa plateforme AI Hub et gérer des défis de données complexes dans plusieurs secteurs. 

La solution a été d'utiliser Weaviate pour simplifier la compréhension des données. Grâce aux capacités d'intégration de son architecture modulaire, il a permis de classer, de valider et d'extraire des données exploitables, rendant ainsi le document correctement structuré et accessible et permettant de prendre de meilleures décisions.

Résultat:En tant que base de données vectorielles open source native de l'IA, elle a considérablement amélioré la pertinence de la recherche et la vitesse d'extraction des données.

Lien vers le site officiel : https://weaviate.io/

#3 Recherche élastique 

Elasticsearch est un plugin de moteur de recherche open source populaire, capable de gérer une large gamme de types de données. Il est connu pour ses capacités de recherche ultra-rapides et ses capacités de pertinence affinées. La société à l'origine d'Elasticsearch est Elastic, établie depuis 2012, qui a connu une croissance significative depuis sa création et est entrée en bourse en 2018.

Principales caractéristiques d'Elasticsearch :

  • Capacités de recherche en texte intégral : Exploitation d'une structure d'index inversée pour une recherche rapide et efficace sur de grands volumes de données textuelles, prenant en charge des requêtes complexes et des recherches de phrases.
  • Évolutivité : Capacité d'évoluer horizontalement sur plusieurs nœuds d'un cluster
  • Traitement en temps réel : offre des capacités de recherche et d'analyse en temps quasi réel, permettant une ingestion rapide des données et une recherche immédiate
  • Flexibilité: L'API RESTful et la prise en charge JSON facilitent l'intégration avec divers langages et outils de programmation
  • Sans schéma et orienté documenté : Permet un stockage de données flexible sans nécessiter de schéma prédéfini et une ingestion facile de données structurées et non structurées
  • Support géospatial : Capacité à gérer efficacement les requêtes et les analyses basées sur la localisation
  • Récupération automatique du nœud : Fonctionnalité intégrée qui permet de maintenir la santé du cluster lorsque les nœuds échouent ou quittent le cluster
  • Réplication inter-cluster : Permet la réplication des index d'un cluster Elasticsearch vers un autre ; utile pour la reprise après sinistre, la localisation des données et les scénarios de reporting centralisés
  • Sécurité de premier ordre : Prend en charge la multilocation et fournit des fonctionnalités de sécurité robustes, notamment le contrôle d'accès basé sur les rôles, le cryptage et la journalisation d'audit

Cas d'utilisation :

Un plugin de recherche élastique est particulièrement adapté aux sites Web de commerce électronique, aux laboratoires de sécurité et, plus particulièrement, à ceux qui ont besoin de recherches de produits avancées, de moteurs de recommandation et de systèmes de gestion des connaissances d'entreprise. Certains des cas d'utilisation de la recherche élastique sont :

  • Recherche de données géospatiales
  • Analyse des données des journaux et des événements
  • Moteurs de recherche de sites Web et de commerce électronique
  • Intelligence d'affaires

Étude de cas :

Défis : Le premier et principal défi consistait à accroître la base d'utilisateurs et les journaux de données qui l'accompagnaient. Le système de journalisation d'Etsy recevait du spam et devenait lent. Comme les ingénieurs n'étaient pas en mesure de regrouper ou de stocker tous les journaux au même endroit, ils ne pouvaient pas corréler les données pour obtenir une analyse. Le système exigeait donc une capacité d'analyse plus avancée.

Technologie: L'outil de recherche élastique est la principale technologie utilisée pour créer cette infrastructure. Il n'est pas gratuit, mais Etsy a payé un abonnement annuel pour utiliser la version cloud d'Elastic Search. C'est l'une des meilleures solutions de journalisation.

Résultat: Etsy a déplacé le traitement des journaux hors site et ils ont réalisé que la migration vers Etsycloud créait la meilleure solution de journalisation pour ses développeurs. Ils ont commencé à créer des représentations visuelles de leurs données de journal qui ont aidé à obtenir des informations sur le fonctionnement de leurs systèmes. Finalement, ils ont pu faire ce qu'ils recherchaient depuis des années : une analyse de leurs données de journal.

Lien vers le site officiel : https://www.elastic.co/elasticsearch

Comparaison des 3 solutions de recherche hybride 

CaractéristiquesPomme de pinTisserRecherche élastique
ÉvolutivitéSpécialisé dans la recherche sémantique vectorielleUtilise la recherche sémantique avec des plongements vectorielsCombine la recherche en texte intégral avec la recherche hybride avancée
IntégrationFonctionne de manière transparente avec les modèles d'apprentissage automatiqueS'intègre bien aux modèles ML et prend en charge divers types de donnéesS'intègre facilement à diverses sources de données et outils externes
Recherche en temps réelConçu pour des recherches en temps réel et hautes performancesPrend en charge les capacités de recherche sémantique en temps réelFournit une recherche et des analyses en temps réel avec des performances élevées
FlexibilitéSe concentre sur les systèmes de recherche et de recommandation de vecteursPrend en charge une gamme de types de données et de cas d'utilisationCapable de requêtes complexes et de filtres détaillés
Fonctionnalités avancéesMeilleur en matière de similarité vectorielle haute dimensionnelle et de mises à jour en temps réelPrend en charge des fonctionnalités robustes de recherche sémantique et de graphique de connaissancesAide à la recherche complète en texte intégral, aux agrégations et au filtrage

Conclusion:

Google devrait faire face à une surveillance accrue de la part du ministère américain de la Justice (DoJ), ce qui aura un impact sur le reste de ses activités, y compris sur le moteur de recherche Google. Cela poussera à adopter davantage de nouveaux types d'expériences de recherche pour égaler ses nouveaux concurrents tels que Perplexity. Ce que cela signifie pour le monde, c'est qu'à mesure que les données augmentent constamment et que les besoins des utilisateurs changent, il est essentiel d'aller au-delà des recherches par mots-clés de base et d'adopter des solutions de recherche hybrides dans votre gamme de produits, pour améliorer l'expérience utilisateur lors de la résolution de requêtes complexes et rester compétitif et pertinent.  

Publié par Alexis Lee
ARTICLE PRÉCÉDENT
Vous aimerez peut-être aussi

Laissez votre commentaire:

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *