Googleの検索ビジネスは ついに 真の競争相手と対決する。
知識の構築と拡大に重点を置く新しい AI 検索企業 Perplexity は、2024 年初頭に月間アクティブ ユーザー数 (MAU) が 1,000 万人に達し、前月比 40% を超える驚異的な成長率を達成しました。
この記事が書かれた時点で、その MAU は 4,000 万から 5,000 万の間です。Google 検索の MAU と比較すると、まだ小さいです。しかし、本当に期待できるのは、それが提供する新しい検索エクスペリエンスです。キーワード検索に基づいて結果を返すなど、ユーザーが知っていることに焦点を当てているだけでなく、検索するキーワードがわからないなど、何を検索すればよいかわからない場合にも、ユーザーの知識を広げてくれます。
これはハイブリッド検索によって実現されます。
ハイブリッド検索とは何ですか?
ハイブリッド検索は、従来のキーワード検索 (キーワードベース) の長所と最新のセマンティック検索機能 (意図ベース) を組み合わせた高度な検索手法です。
検索エンジンの結果は、主にキーワードのマッチングに依存します。たとえば、高解像度カメラを搭載した最高のスマートフォンを検索する場合、従来のキーワード検索では、「スマートフォン」と「高解像度カメラ」を含むキーワードの結果のみが表示され、レビュー、比較、低照度でのパフォーマンス、ビデオ機能などのコンテキスト固有の洞察などの情報を見逃す可能性があります。
しかし、セマンティック検索はスマートフォンを購入する意図を理解しますが、キーワード検索とセマンティック検索を組み合わせることで、より正確な結果と包括的な結果セットを実現できます。これがハイブリッド検索です。
2024 年にハイブリッド検索が重要になる理由
Amazon や eBay などのトップ e コマース企業でさえ、より優れた推奨やエクスペリエンスの向上のためにハイブリッド検索アルゴリズムを使用していることをご存知ですか? スタートアップ企業では、さらに迅速に動いています。たとえば、英国を拠点とするスタートアップ企業 Moonsift は、ハイブリッド検索を活用して、オンライン ショッピングのユーザーが好みの製品を見つけられるようにしています。 ムーンシフト は、ユーザーがインターネット上の製品を集めたショッピング可能なボードをキュレートするための電子商取引ブラウザ拡張機能を提供しており、これはユーザーが望む正確な結果やサービスを提供するために不可欠です。
ユーザーに完璧なエクスペリエンスを提供し、ユーザーが理解されていると感じさせることは不可欠であり、それが 2024 年にハイブリッド検索が重要になる理由です。
2024 年のトップハイブリッド検索ソリューション
市場には数多くのハイブリッド検索ツールがあります。以下では、トップ3のツールを調査しました。 ハイブリッド検索ソリューション ぜひチェックしてみる価値があると思います。
#1 松ぼっくり
Pinecone プラットフォームは、検索アプリケーション向けに設計されたクラウドベースのベクター データベースです。ベクター検索とキーワード、使い慣れたメタデータ フィルターを組み合わせて、最新かつ関連性の高い結果を取得します。セマンティック検索やマルチモーダル検索機能、候補生成サービスのためのユーザー API インターフェイスを提供します。手間のかからないインフラストラクチャにより、AI ソリューションの作成が簡単になります。
松ぼっくりの主な特徴
- オールインワンソリューション: キーワード検索とセマンティック検索を 1 つのシステムに統合し、実装と管理を簡素化します。
- カスタマイズ可能な関連性: ビジネスニーズに合わせて、完全一致と関連コンセプトのバランスを簡単に調整できます。
- 多用途アプリケーション: テキスト、画像、オーディオなど、さまざまな種類のコンテンツに対応し、多様なビジネスユースケースに適しています。
- スケーラビリティ: 大量のデータを効率的に処理し、パフォーマンスの問題なしにビジネスの成長に合わせて拡張します。
- 使いやすい: 簡単な API を通じて既存のシステムとシームレスに統合し、技術的な複雑さを軽減します。
- 精度の向上: 特定の用語と全体的なコンテキストの両方を考慮して検索精度を高め、ユーザー エクスペリエンスを向上させます。
- コスト効率が高い: 複数の検索ソリューションが不要になり、運用コストと複雑さが軽減される可能性があります。
- 適応性: さまざまな業界標準の検索モデルをサポートし、特定のビジネス要件に基づいて柔軟に実装できます。
使用例:
Pinecone は、パーソナライズされた推奨事項の提供、リアルタイムの検索類似性、高速で正確な検索機能を必要とする AI アプリケーションの作成に役立ちます。Pinecone の使用例の一部を以下に示します。
- 電子商取引製品検索: 製品の発見と関連性の向上。
- オープンドメインの質問応答: 一般知識クエリの精度を向上します。
- コンテキストチャットボット: 会話型 AI でより関連性の高い応答を提供します。
- パーソナライズされた検索エクスペリエンス: ユーザーの好みや行動に基づいて結果をカスタマイズします。
- 検索拡張生成 (RAG): 関連情報検索による言語モデル出力の強化。
- エンタープライズ検索: 多様な企業データにわたる情報検索を改善します。
- コンテンツ推奨システム: ユーザーに関連コンテンツを提案します。
ケーススタディ:
ケーススタディを見てみましょう Pinecone は Entrapeer の成功に貢献しました。
課題: Entrapeer は、20 万件以上のユースケースと 300 万件以上のスタートアップ プロファイルを持つプラットフォームですが、大量のデータ処理に課題を抱えていました。ユーザーが迅速に洞察を得たり、高度に洗練されたデータセットをナビゲートしたりするのは困難でした。探索プロセスは時間がかかり、非効率的で、意思決定に悪影響を及ぼしていました。
解決: 彼らは、データ アクセスを支援するために Pinecone のベクトル データベース テクノロジーを実装しました。埋め込みを使用することで、Pinecone は大量のデータ処理を簡素化し、より迅速な洞察を提供しました。
達成された成果: なんと、pinecone の実装はさまざまな点でプラスに働きました。まず、プラットフォームは数千のユースケースの処理を開始し、数百万のスタートアップ プロファイルを受け取りました。以前は手動で行われていたため、99% による処理オーバーヘッドの削減という観点からすると、結果は衝撃的でした。
その他のプラスポイントは、クライアントがデータセットを素早くナビゲートし、非常に効率的な意思決定を行ったことで、これによりプラットフォームが市場のリーダーであり続けることができました。
公式ウェブサイトリンク: https://www.pinecone.io/
#2 ウィービエイト
Weaviate はオープンソースのベクター データベース プロバイダーであり、ハイブリッド検索を主要機能の 1 つとして提供しています。チームは急速に拡大し、従業員数は 80 名を超え、スタートアップとエンタープライズの両方のクライアントにサービスを提供しています。
Weaviate のハイブリッド検索では、スパース ベクトル (キーワード検索用) と密なベクトル (セマンティック検索用) の両方を使用して、検索クエリとドキュメントの意味とコンテキストを表します。
Weaviate の主な機能:
- 複数の検索アルゴリズムを組み合わせて精度と関連性を向上
- 生成フィードバックループ: モデルから生成された結果を取得し、ベクトル化して、将来使用するためにデータベースに保存します。これにより、データの生成、保存、取得のサイクルが作成され、AIアプリケーションの機能が強化されます。
- リアルタイム処理: データのインポート中や変更中でも、リアルタイムでデータを検索および更新する機能
- コスト効率の高いアーキテクチャ: すべてをメモリに保存せずに大規模なデータセットを管理する機能を備え、速度とコストの戦略的なバランスを実現
- 柔軟性: さまざまなプログラミング言語とGraphQLクエリをサポート
- スケーラビリティ: 大規模なデータセットと大量のクエリを処理するために水平方向に拡張できるように設計されています
- マルチモーダル: テキスト、画像など複数のデータタイプを処理できるため、さまざまなアプリケーションに汎用的に使用できます。
- AIモデルの統合: さまざまなAIおよび機械学習モデルとシームレスに統合
使用例:
Weaviate は、チャットボットや AI 駆動型検索エンジンなど、コンテキスト理解を必要とするアプリケーションに最適です。Weaviate の使用例の一部を以下に示します。
- 電子商取引製品検索:
- 正確なキーワード一致と意味的に関連するアイテムを組み合わせることで、商品の発見が向上します。
- ユーザーエクスペリエンスを向上させ、コンバージョン率を向上できる可能性がある
- コンテンツ推奨システム:
- 特定の用語と全体的なコンテキストの両方を理解して、より関連性の高いコンテンツを提案します。
- ユーザーのエンゲージメントとプラットフォーム上での滞在時間の増加
- ナレッジ管理システム:
- 企業環境におけるより効率的な情報検索を促進
- より正確な検索結果を提供することで従業員の生産性を向上
ケーススタディ:
課題Instabase は、1 日に 50 万件以上のドキュメントを処理するエンタープライズ グレードの AI アプリケーション プラットフォームです。毎日膨大なデータを処理するため、ドキュメントの処理と理解が課題であることは明らかでした。同社が Weaviate を選んだのは、主要なオープン ソース ツールが提供する柔軟性と、テストした他のどのデータベースよりも優れた Instabase の重要なパフォーマンス メトリックを達成したからです。
解決Instabase は Weaviate を使用して AI Hub プラットフォームを強化し、複数の業界にわたる複雑なデータの課題に対処しています。
解決策は、Weaviate を使用してデータの理解を簡素化することでした。モジュール アーキテクチャの統合機能により、使用可能なデータの分類、検証、抽出が可能になり、ドキュメントが適切に構造化され、アクセスしやすくなり、より適切な意思決定が可能になります。
結果: AIネイティブのオープンソースベクターデータベースであるため、検索の関連性とデータ抽出速度が大幅に向上しました。
公式ウェブサイトリンク: https://weaviate.io/
#3 エラスティックサーチ
Elasticsearch は、さまざまなデータ タイプを処理できる人気の高いオープン ソースの検索エンジン プラグインです。超高速の検索と、きめ細かな関連性機能で知られています。Elasticsearch の背後にある会社は Elastic で、2012 年から長い歴史を持ち、設立以来大きく成長し、2018 年に株式を公開しました。
Elasticsearch の主な機能:
- 全文検索機能: 逆インデックス構造を活用して、大量のテキスト データ全体を高速かつ効率的に検索し、複雑なクエリやフレーズ検索をサポートします。
- スケーラビリティ: クラスタ内の複数のノードにわたって水平にスケーリングする機能
- リアルタイム処理: ほぼリアルタイムの検索と分析機能を提供し、迅速なデータ取り込みと即時検索を可能にします。
- 柔軟性: RESTful APIとJSONのサポートにより、さまざまなプログラミング言語やツールとの統合が容易になります。
- スキーマフリーでドキュメント指向: 事前定義されたスキーマを必要とせずに柔軟なデータストレージを可能にし、構造化データと非構造化データを簡単に取り込むことができます。
- 地理空間サポート: 位置情報に基づくクエリと分析を効率的に処理する機能
- 自動ノード回復: ノードが故障したり、クラスタから離脱したりしたときにクラスタの健全性を維持するのに役立つ組み込み機能
- クラスター間レプリケーション: ある Elasticsearch クラスターから別のクラスターへのインデックスのレプリケーションを可能にします。災害復旧、データの局所性、集中レポートのシナリオに役立ちます。
- 最高レベルのセキュリティ: マルチテナントをサポートし、ロールベースのアクセス制御、暗号化、監査ログなどの強力なセキュリティ機能を提供します。
使用例:
エラスティック検索プラグインは、eコマースのウェブサイト、セキュリティラボ、特に高度な製品検索、推奨エンジン、エンタープライズ知識管理システムを必要とするものに最適です。エラスティック検索の使用例の一部を以下に示します。
- 地理空間データ検索
- ログとイベントデータの分析
- ウェブサイトおよび電子商取引検索エンジン
- ビジネスインテリジェンス
ケーススタディ:
課題: 第一の課題は、ユーザー ベースとそれに伴うデータ ログを増やすことでした。Etsy のログ システムはスパムを受信し、速度が低下しました。エンジニアはすべてのログを 1 か所に集約または保存できなかったため、データを相関させて分析することができませんでした。そのため、システムにはより高度な分析機能が必要でした。
テクノロジー: Elastic Search ツールは、このインフラストラクチャを作成するために使用される主要なテクノロジーです。無料ではありませんが、Etsy は Elastic Search のクラウドベース バージョンを使用するために年間サブスクリプション料金を支払いました。最高のログ ソリューションの 1 つです。
結果: Etsy はログ処理をオフプレミスに移行し、Etsycloud への移行が開発者にとって最適なログ ソリューションとなることに気付きました。彼らはログ データの視覚的表現を作成し始め、システムの動作状況に関する洞察を得るのに役立てました。ついに、彼らは何年も探し求めていた、ログ データの優れた分析を実現できました。
公式ウェブサイトリンク: https://www.elastic.co/elasticsearch
3つのハイブリッド検索ソリューションの比較
特徴 | 松ぼっくり | ウィービエイト | エラスティックサーチ |
スケーラビリティ | ベクトルベースのセマンティック検索に特化 | ベクトル埋め込みによるセマンティック検索を使用する | 全文検索と高度なハイブリッド検索を組み合わせた |
統合 | 機械学習モデルとシームレスに連携 | MLモデルとうまく統合し、多様なデータタイプをサポート | さまざまなデータソースや外部ツールと簡単に統合できます |
リアルタイム検索 | リアルタイムの高性能検索向けに設計 | リアルタイムセマンティック検索機能をサポート | 強力なパフォーマンスでリアルタイムの検索と分析を提供します |
柔軟性 | ベクトル検索と推奨システムに焦点を当てる | さまざまなデータタイプとユースケースをサポート | 複雑なクエリと詳細なフィルターが可能 |
高度な機能 | 高次元ベクトル類似性とリアルタイム更新の最高峰 | 強力なセマンティック検索とナレッジグラフ機能をサポート | 包括的な全文検索、集計、フィルタリングに役立ちます |
結論:
Google が米国司法省 (DoJ) からさらに厳しい監視を受けることが予想されるため、これは Google 検索ビジネスを含む同社の他のビジネスに衝撃を与えるでしょう。これにより、Perplexity などの競合相手に対抗するために、新しい検索タイプのエクスペリエンスの採用が促進されます。これは、データが絶えず増加し、ユーザーのニーズが変化する中で、基本的なキーワード検索を超えて、製品スタックにハイブリッド検索ソリューションを採用し、複雑なクエリに取り組む際のユーザーエクスペリエンスを向上させ、競争力と関連性を維持することが不可欠であることを意味します。
最新のブログ投稿の更新情報を受け取るには購読してください
コメントを残す: