Das Suchgeschäft von Google ist Endlich gegen einen echten Konkurrenten antreten.

Ein neues KI-Suchunternehmen namens Perplexity, das sich auf den Aufbau und die Erweiterung von Wissen konzentriert, hat bereits im Jahr 2024 10 Millionen monatlich aktive Benutzer (MAU) erreicht und eine erstaunliche monatliche Wachstumsrate von über 401 TP3T verzeichnet.

Zum Zeitpunkt der Erstellung dieses Artikels lag die MAU zwischen 40 und 50 Millionen. Verglichen mit der MAU der Google-Suche ist sie immer noch winzig. Wirklich vielversprechend ist jedoch das neue Sucherlebnis, das sie bietet. Sie konzentriert sich nicht nur auf das, was Sie wissen, z. B. liefert sie Ergebnisse basierend auf der Stichwortsuche, sondern erweitert auch Ihr Wissen, wenn Sie nicht sicher sind, wonach Sie suchen sollen, z. B. wenn Sie das Stichwort nicht kennen. 

Dies wird durch die Hybridsuche ermöglicht. 

Was ist die Hybridsuche?

Die Hybridsuche ist eine erweiterte Suchtechnik, die die Stärken der herkömmlichen Stichwortsuche (stichwortbasiert) mit modernen semantischen Suchfunktionen (absichtsbasiert) kombiniert. 

Die Ergebnisse von Suchmaschinen hängen hauptsächlich von der Übereinstimmung der Schlüsselwörter ab. Wenn Sie beispielsweise nach den besten Smartphones mit hochauflösenden Kameras suchen, werden bei der herkömmlichen Schlüsselwortsuche nur Ergebnisse mit den Schlüsselwörtern „Smartphones“ und „hochauflösende Kamera“ angezeigt, aber möglicherweise fehlen Ihnen Informationen wie Testberichte, Vergleiche und andere kontextspezifische Einblicke wie Leistung bei schlechten Lichtverhältnissen, Videofunktionen und mehr.

Die semantische Suche erkennt zwar Ihre Absicht beim Kauf eines Smartphones, aber Sie können genauere Ergebnisse und einen umfassenderen Ergebnissatz erzielen, indem Sie die Schlüsselwortsuche und die semantische Suche kombinieren. Und das ist die hybride Suche.

Warum ist die Hybridsuche im Jahr 2024 wichtig?

Wussten Sie, dass selbst die größten E-Commerce-Unternehmen wie Amazon und eBay hybride Suchalgorithmen verwenden, um bessere Empfehlungen und ein besseres Erlebnis zu erzielen? Bei Startups geht man sogar noch schneller vor. Das britische Startup Moonsift beispielsweise nutzt die hybride Suche, um Online-Käufern dabei zu helfen, die Produkte zu finden, die sie lieben. Mondsichel bietet eine E-Commerce-Browsererweiterung, mit der Benutzer Einkaufsboards mit Produkten aus dem gesamten Internet zusammenstellen können. Dies ist von entscheidender Bedeutung, um Benutzern genau die Ergebnisse oder Dienste zu liefern, die sie wünschen. 

Es ist wichtig, den Benutzern das perfekte Erlebnis zu bieten und ihnen das Gefühl zu geben, verstanden zu werden. Deshalb ist die hybride Suche im Jahr 2024 so wichtig. 

Die besten Hybrid-Suchlösungen im Jahr 2024

Es gibt viele hybride Suchwerkzeuge auf dem Markt. Im Folgenden haben wir die drei besten untersucht Hybride Suchlösungen die einen Blick wert sein werden.

#1 Tannenzapfen

Die Pinecone-Plattform ist eine cloudbasierte Vektordatenbank, die für Suchanwendungen entwickelt wurde. Sie kombiniert die Vektorsuche mit Schlüsselwörtern und bekannten Metadatenfiltern, um die aktuellsten und relevantesten Ergebnisse zu erhalten. Sie bietet eine Benutzer-API-Schnittstelle für semantische und multimodale Suchfunktionen sowie Dienste zur Kandidatengenerierung. Die unkomplizierte Infrastruktur vereinfacht die Erstellung von KI-Lösungen. 

Hauptmerkmale von Pinecone

  • All-in-One-Lösung: Kombiniert Stichwort- und semantische Suche in einem einzigen System und vereinfacht so Implementierung und Verwaltung.
  • Anpassbare Relevanz: Passen Sie das Gleichgewicht zwischen exakten Übereinstimmungen und verwandten Konzepten einfach an Ihre Geschäftsanforderungen an.
  • Vielseitige Anwendung: Funktioniert mit verschiedenen Inhaltstypen, einschließlich Text, Bildern und Audio, und ist daher für unterschiedliche geschäftliche Anwendungsfälle geeignet.
  • Skalierbarkeit: Verarbeitet große Datenmengen effizient und wächst mit Ihrem Unternehmen ohne Leistungsprobleme.
  • Benutzerfreundlich: Lässt sich über eine unkomplizierte API nahtlos in bestehende Systeme integrieren und reduziert so die technische Komplexität.
  • Verbesserte Genauigkeit: Verbessert die Suchpräzision durch Berücksichtigung sowohl spezifischer Begriffe als auch des Gesamtkontexts und führt so zu einem besseren Benutzererlebnis.
  • Kostengünstig: Macht mehrere Suchlösungen überflüssig und reduziert potenziell Betriebskosten und Komplexität.
  • Anpassungsfähig: Unterstützt verschiedene branchenübliche Suchmodelle und ermöglicht so eine flexible Implementierung basierend auf spezifischen Geschäftsanforderungen.

Anwendungsfälle:

Pinecone ist nützlich, um personalisierte Empfehlungen und Echtzeit-Suchähnlichkeiten bereitzustellen und KI-Anwendungen zu erstellen, die schnelle und genaue Suchfunktionen erfordern. Einige der Anwendungsfälle von Pinecones sind: 

  • E-Commerce-Produktsuche: Verbesserung der Produktauffindbarkeit und -relevanz.
  • Beantwortung von Fragen zur offenen Domain: Verbesserung der Genauigkeit bei allgemeinen Wissensabfragen.
  • Kontextbezogene Chatbots: Bereitstellung relevanterer Antworten in der Konversations-KI.
  • Personalisierte Sucherlebnisse: Anpassung der Ergebnisse an Benutzerpräferenzen und -verhalten.
  • Retrieval Augmented Generation (RAG): Verbessern der Sprachmodellausgaben durch Abrufen relevanter Informationen.
  • Unternehmenssuche: Verbesserung des Informationsabrufs über verschiedene Unternehmensdaten hinweg.
  • Inhaltsempfehlungssysteme: Benutzern relevante Inhalte vorschlagen.

Fallstudie:

Lassen Sie uns die Fallstudie untersuchen, wie Pinecone hat zum Erfolg von Entrapeer beigetragen.

Herausforderungen: Entrapeer ist eine Plattform mit über 200.000 Anwendungsfällen und über 3 Millionen Startup-Profilen. Die Datenverarbeitungsmengen waren für die Benutzer eine Herausforderung. Für die Benutzer war es schwierig, schnell Erkenntnisse zu gewinnen und sich in den hochkomplexen Datensätzen zurechtzufinden. Der Explorationsprozess war zeitaufwändig und ineffizient, was sich negativ auf die Entscheidungsfindung auswirkte. 

Lösung: Sie implementierten die Vektordatenbanktechnologie von Pinecone, um den Datenzugriff zu erleichtern. Durch die Verwendung von Einbettungen vereinfachte Pinecone die Verarbeitung großer Datenmengen und lieferte schnellere Erkenntnisse.

Das erreichte Ergebnis: Raten Sie mal, die Implementierung von Pinecone erwies sich in vielerlei Hinsicht als positiv. Zunächst begann die Plattform mit der Verarbeitung von Tausenden von Anwendungsfällen und erhielt Millionen von Startprofilen. Zuvor wurde dies manuell erledigt, daher war das Ergebnis im Kontext der Reduzierung des Verarbeitungsaufwands durch 99% schockierend. 

Weitere Pluspunkte waren die schnelle Navigation der Kunden durch die Datensätze und die hocheffiziente Entscheidungsfindung, die dazu beitrugen, dass die Plattform ihre Spitzenposition auf dem Markt behauptete.

Offizieller Website-Link: https://www.pinecone.io/

#2 Weaviate

Weaviate ist ein Anbieter von Open-Source-Vektordatenbanken und bietet als eine seiner Hauptfunktionen die Hybridsuche an. Das Team ist schnell auf über 80 Mitarbeiter angewachsen und betreut sowohl Startup- als auch Unternehmenskunden.  

Die Hybridsuche von Weaviate verwendet sowohl spärliche Vektoren (für die Stichwortsuche) als auch dichte Vektoren (für die semantische Suche), um die Bedeutung und den Kontext von Suchanfragen und Dokumenten darzustellen.

Hauptfunktionen von Weaviate:

  • Kombiniert mehrere Suchalgorithmen für verbesserte Genauigkeit und Relevanz
  • Generative Rückkopplungsschleifen: Die aus Modellen generierten Ergebnisse werden vektorisiert und zur späteren Verwendung wieder in der Datenbank gespeichert. Dadurch entsteht ein Zyklus aus Datengenerierung, -speicherung und -abruf, der die Fähigkeiten von KI-Anwendungen verbessern kann.
  • Echtzeitverarbeitung: Möglichkeit zur Suche und Aktualisierung von Daten in Echtzeit, selbst während Daten importiert oder geändert werden
  • Kostengünstige Architektur: Strategisches Gleichgewicht zwischen Geschwindigkeit und Kosten mit der Fähigkeit, große Datensätze zu verwalten, ohne alles im Speicher behalten zu müssen
  • Flexibilität: Unterstützt verschiedene Programmiersprachen und GraphQL-Abfragen
  • Skalierbarkeit: Horizontal skalierbar, um große Datensätze und hohe Abfragevolumina verarbeiten zu können
  • Multimodal: Kann mehrere Datentypen verarbeiten, darunter Text, Bilder und mehr, und ist daher vielseitig für verschiedene Anwendungen geeignet
  • Integration von KI-Modellen: Nahtlose Integration mit verschiedenen KI- und Machine-Learning-Modellen

Anwendungsfälle:

Weaviate eignet sich vor allem für Anwendungen, die kontextbezogenes Verständnis erfordern, wie etwa Chatbots oder KI-gesteuerte Suchmaschinen. Einige der Anwendungsfälle von Weaviate sind:

  1. E-Commerce-Produktsuche:
    • Verbessert die Produktauffindbarkeit durch die Kombination exakter Keyword-Übereinstimmungen mit semantisch verwandten Artikeln
    • Verbessert das Benutzererlebnis und erhöht potenziell die Konversionsraten
  2. Inhaltsempfehlungssysteme:
    • Liefert relevantere Inhaltsvorschläge durch das Verständnis sowohl spezifischer Begriffe als auch des Gesamtkontexts
    • Erhöht das Engagement der Benutzer und die auf der Plattform verbrachte Zeit
  3. Wissensmanagementsysteme:
    • Ermöglicht eine effizientere Informationsbeschaffung in Unternehmensumgebungen
    • Verbessert die Mitarbeiterproduktivität durch präzisere Suchergebnisse

Fallstudie:

Herausforderungen: Instabase ist eine KI-Anwendungsplattform für Unternehmen, die über 500.000 Dokumente pro Tag verarbeitet. Die Herausforderung war ziemlich offensichtlich: die Verarbeitung und das Verständnis von Dokumenten, da täglich große Datenmengen verarbeitet werden. Sie entschieden sich für Weaviate, weil ihnen ein führendes Open-Source-Tool Flexibilität bot und gleichzeitig die kritischen Leistungskennzahlen von Instabase besser erreichte als jede andere von ihnen getestete Datenbank.

Lösung: Instabase verwendet Weaviate, um seine AI Hub-Plattform zu betreiben und komplexe Datenherausforderungen in mehreren Branchen zu bewältigen. 

Die Lösung bestand darin, Weaviate zu verwenden, um das Datenverständnis zu vereinfachen. Dank der integrativen Fähigkeiten seiner modularen Architektur half es dabei, nutzbare Daten zu klassifizieren, zu validieren und zu extrahieren, wodurch das Dokument richtig strukturiert und zugänglich wurde und bessere Entscheidungen möglich wurden.

Ergebnis: Da es sich um eine KI-native Open-Source-Vektordatenbank handelt, wurden die Suchrelevanz und die Geschwindigkeit der Datenextraktion erheblich verbessert.

Offizieller Website-Link: https://weaviate.io/

#3 Elasticsearch 

Elasticsearch ist ein beliebtes Open-Source-Suchmaschinen-Plugin, das eine Vielzahl von Datentypen verarbeiten kann. Es ist für seine blitzschnelle Suche und fein abgestimmten Relevanzfunktionen bekannt. Das Unternehmen hinter Elasticsearch ist Elastic, das seit 2012 besteht, seit seiner Gründung stark gewachsen ist und 2018 an die Börse ging.

Hauptfunktionen von Elasticsearch:

  • Volltextsuchfunktionen: Nutzung einer invertierten Indexstruktur für die schnelle und effiziente Suche in großen Mengen von Textdaten, die komplexe Abfragen und Phrasensuchen unterstützt.
  • Skalierbarkeit: Möglichkeit zur horizontalen Skalierung über mehrere Knoten in einem Cluster
  • Echtzeitverarbeitung: bietet Such- und Analysefunktionen nahezu in Echtzeit und ermöglicht so eine schnelle Datenaufnahme und sofortige Durchsuchbarkeit
  • Flexibilität: RESTful API und JSON-Unterstützung erleichtern die Integration mit verschiedenen Programmiersprachen und Tools
  • Schemafrei und dokumentenorientiert: Ermöglicht eine flexible Datenspeicherung ohne vordefiniertes Schema und die einfache Aufnahme strukturierter und unstrukturierter Daten
  • Georäumliche Unterstützung: Fähigkeit, standortbasierte Abfragen und Analysen effizient zu verarbeiten
  • Automatische Knotenwiederherstellung: Integrierte Funktion, die dabei hilft, die Cluster-Integrität aufrechtzuerhalten, wenn Knoten ausfallen oder den Cluster verlassen
  • Clusterübergreifende Replikation: Ermöglicht die Replikation von Indizes von einem Elasticsearch-Cluster zu einem anderen; nützlich für Notfallwiederherstellung, Datenlokalität und zentralisierte Berichtsszenarien.
  • Erstklassige Sicherheit: Unterstützt Mandantenfähigkeit und bietet robuste Sicherheitsfunktionen, einschließlich rollenbasierter Zugriffskontrolle, Verschlüsselung und Prüfprotokollierung.

Anwendungsfälle:

Ein Elastic-Search-Plugin eignet sich am besten für E-Commerce-Websites, Sicherheitslabore und insbesondere für alle, die erweiterte Produktsuchen, Empfehlungsmaschinen und Wissensmanagementsysteme für Unternehmen benötigen. Einige der Anwendungsfälle von Elastic Search sind:

  • Geodatensuche
  • Protokoll- und Ereignisdatenanalyse
  • Website- und E-Commerce-Suchmaschinen
  • Business Intelligence

Fallstudie:

Herausforderungen: Die erste und wichtigste Herausforderung bestand darin, die Benutzerbasis und die damit verbundenen Datenprotokolle zu vergrößern. Das Protokollierungssystem von Etsy empfing Spam und wurde langsam. Da die Ingenieure nicht in der Lage waren, alle Protokolle an einem Ort zu aggregieren oder zu speichern, konnten sie die Daten nicht korrelieren, um eine Analyse zu erhalten. Daher erforderte das System eine erweiterte Analysefunktion.

Technologie: Das Elastic Search Tool ist die Haupttechnologie, die zum Erstellen dieser Infrastruktur verwendet wird. Es ist nicht kostenlos, aber Etsy hat eine jährliche Abonnementgebühr bezahlt, um die Cloud-basierte Version von Elastic Search zu verwenden. Es ist eine der besten Protokollierungslösungen.

Ergebnis: Etsy hat die Protokollverarbeitung an einen anderen Standort verlagert und erkannte, dass die Migration zu Etsycloud die beste Protokollierungslösung für seine Entwickler darstellte. Sie begannen, visuelle Darstellungen ihrer Protokolldaten zu erstellen, die ihnen dabei halfen, Einblicke in die Funktionsweise ihrer Systeme zu gewinnen. Endlich konnten sie das tun, wonach sie seit Jahren gesucht hatten – eine erstklassige Analyse ihrer Protokolldaten.

Offizieller Website-Link: https://www.elastic.co/elasticsearch

Vergleich der 3 Hybrid-Suchlösungen 

MerkmaleTannenzapfenWebenElasticsearch
SkalierbarkeitSpezialisiert auf vektorbasierte semantische SucheVerwendet semantische Suche mit VektoreinbettungenKombiniert Volltextsuche mit erweiterter Hybrid
IntegrationFunktioniert nahtlos mit Modellen des maschinellen LernensLässt sich gut in ML-Modelle integrieren und unterstützt verschiedene DatentypenEinfache Integration mit verschiedenen Datenquellen und externen Tools
EchtzeitsucheEntwickelt für leistungsstarke Suchen in EchtzeitUnterstützt semantische Suchfunktionen in EchtzeitBietet Echtzeitsuche und -analyse mit starker Leistung
FlexibilitätKonzentriert sich auf Vektorsuch- und EmpfehlungssystemeUnterstützt eine Reihe von Datentypen und AnwendungsfällenUnterstützt komplexe Abfragen und detaillierte Filter
Erweiterte FunktionenBeste hochdimensionale Vektorähnlichkeit und Echtzeit-UpdatesUnterstützt robuste semantische Such- und WissensgraphenfunktionenHilft bei umfassender Volltextsuche, Aggregationen und Filterung

Abschluss:

Da Google voraussichtlich stärker vom US-Justizministerium (DoJ) unter die Lupe genommen wird, wird dies eine Schockwelle für den Rest des Unternehmens, einschließlich der Google-Suche, auslösen. Dies wird zu einer stärkeren Einführung neuer Suchtypen führen, um mit den neuen Konkurrenten wie Perplexity mithalten zu können. Für die Welt bedeutet dies, dass es angesichts ständig wachsender Daten und sich ändernder Benutzeranforderungen unerlässlich ist, über einfache Stichwortsuchen hinauszugehen und hybride Suchlösungen in Ihren Produktstapel aufzunehmen, um die Benutzererfahrung bei der Bearbeitung komplexer Abfragen zu verbessern und wettbewerbsfähig und relevant zu bleiben.  

Veröffentlicht von Alexis Lee
VORHERIGER BEITRAG
Das gefällt dir vielleicht auch

Hinterlassen Sie Ihren Kommentar:

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert