1티피1티

구글의 검색 사업은 마지막으로 실제 경쟁자와 대결합니다.

지식 구축 및 확장에 중점을 둔 새로운 AI 검색 회사인 Perplexity는 2024년 초에 월간 활성 사용자(MAU)가 1,000만 명에 도달하여 40%가 넘는 엄청난 월간 성장률을 경험했습니다.

이 글이 쓰여졌을 당시, MAU는 40M에서 50M 사이였습니다. Google 검색 MAU와 비교하면 여전히 작습니다. 그러나 정말 유망한 것은 제공하는 새로운 검색 경험입니다. 키워드 검색에 따른 결과 반환과 같이 아는 것에만 초점을 맞추는 것이 아니라 무엇을 검색해야 할지 잘 모를 때(예: 검색할 키워드를 모를 때) 지식을 확장합니다. 

이는 하이브리드 검색을 통해 가능합니다. 

하이브리드 검색이란?

하이브리드 검색은 기존 키워드 검색(키워드 기반)의 장점과 최신 의미 검색 기능(의도 기반)의 장점을 결합한 고급 검색 기술입니다. 

검색 엔진 결과는 주로 키워드 매칭에 따라 달라집니다. 예를 들어, 고화질 카메라가 장착된 최고의 스마트폰을 검색하는 경우 기존 키워드 검색은 "스마트폰"과 "고화질 카메라"가 포함된 키워드로만 결과를 표시하지만 리뷰, 비교 및 저조도 성능, 비디오 기능 등과 같은 컨텍스트별 통찰력과 같은 정보를 놓칠 수 있습니다.

하지만 의미 검색은 스마트폰을 구매하는 의도를 이해하지만 키워드 검색과 의미 검색을 결합하면 더 정확한 결과와 포괄적인 결과 세트를 얻을 수 있습니다. 이것이 하이브리드 검색입니다.

2024년에 하이브리드 검색이 중요한 이유는?

Amazon과 eBay와 같은 최고의 전자상거래 회사조차도 더 나은 추천과 향상된 경험을 위해 하이브리드 검색 알고리즘을 사용한다는 것을 알고 계십니까? 스타트업 분야에서는 더욱 빠르게 움직입니다. 예를 들어, 영국에 있는 스타트업 Moonsift는 하이브리드 검색을 활용하여 온라인 쇼핑객이 좋아하는 제품을 찾을 수 있도록 돕고 있습니다. 문시프트 사용자가 인터넷 전반의 제품으로 쇼핑 가능한 보드를 큐레이션할 수 있는 전자상거래 브라우저 확장 프로그램을 제공하는데, 이는 사용자에게 정확한 결과나 원하는 서비스를 제공하는 데 필수적입니다. 

사용자에게 완벽한 경험을 제공하고 사용자가 이해받았다고 느끼게 하는 것이 필수적이며, 그렇기 때문에 2024년에는 하이브리드 검색이 중요합니다. 

2024년 최고의 하이브리드 검색 솔루션

시중에는 다양한 하이브리드 검색 도구가 있습니다. 아래에서 우리는 상위 3개의 도구를 조사했습니다. 하이브리드 검색 솔루션 꼭 확인해보실 만한 내용입니다.

#1 솔방울

Pinecone 플랫폼은 검색 애플리케이션을 위해 설계된 클라우드 기반 벡터 데이터베이스입니다. 벡터 검색을 키워드와 익숙한 메타데이터 필터와 결합하여 최신의 관련 결과를 얻습니다. 의미론적 및 다중 모달 검색 기능과 후보 생성 서비스를 위한 사용자 API 인터페이스를 제공합니다. 번거로움 없는 인프라로 AI 솔루션을 만드는 것이 간단해집니다. 

솔방울의 주요 특징

  • 올인원 솔루션: 키워드와 의미 검색을 단일 시스템으로 결합하여 구현과 관리를 간소화합니다.
  • 사용자 정의 가능한 관련성: 귀사의 비즈니스 요구에 맞춰 정확한 일치와 관련 개념 간의 균형을 쉽게 조정하세요.
  • 다양한 응용 프로그램: 텍스트, 이미지, 오디오 등 여러 가지 콘텐츠 유형을 처리하므로 다양한 비즈니스 활용 사례에 적합합니다.
  • 확장성: 성능 문제 없이 비즈니스가 성장함에 따라 대량의 데이터를 효율적으로 처리합니다.
  • 사용자 친화적: 간단한 API를 통해 기존 시스템과 완벽하게 통합되어 기술적 복잡성이 줄어듭니다.
  • 향상된 정확도: 구체적인 용어와 전반적인 맥락을 모두 고려하여 검색 정확도를 높이고 더 나은 사용자 경험을 제공합니다.
  • 비용 효율성: 여러 검색 솔루션의 필요성을 없애고 운영 비용과 복잡성을 줄이는 효과가 있습니다.
  • 적응할 수 있는: 다양한 산업 표준 검색 모델을 지원하므로 특정 비즈니스 요구 사항에 따라 유연하게 구현할 수 있습니다.

사용 사례:

Pinecone은 개인화된 추천, 실시간 검색 유사성 제공, 빠르고 정확한 검색 기능이 필요한 AI 애플리케이션 생성에 유용합니다. Pinecone의 일부 사용 사례는 다음과 같습니다. 

  • 전자상거래 상품 검색: 제품 발견 및 관련성 개선
  • 오픈 도메인 질의응답: 일반 지식에 대한 질의의 정확도를 높입니다.
  • 상황에 맞는 챗봇: 대화형 AI에서 더욱 관련성 있는 응답을 제공합니다.
  • 개인화된 검색 경험: 사용자의 선호도와 행동에 따라 결과를 맞춤화합니다.
  • 검색 증강 생성(RAG): 관련 정보 검색을 통해 언어 모델 출력을 향상시킵니다.
  • 엔터프라이즈 검색: 다양한 기업 데이터에 대한 정보 검색을 개선합니다.
  • 콘텐츠 추천 시스템: 사용자에게 관련성 있는 콘텐츠를 제안합니다.

사례 연구:

사례 연구를 살펴보겠습니다. 파인콘은 엔트라피어의 성공에 도움을 주었습니다.

과제: Entrapeer는 200,000개 이상의 사용 사례와 300만 개 이상의 스타트업 프로필을 보유한 플랫폼으로, 방대한 양의 데이터 처리에 어려움을 겪었습니다. 사용자가 빠르게 통찰력을 얻고 매우 정교한 데이터 세트를 탐색하는 것이 어려웠습니다. 탐색 프로세스는 시간이 많이 걸리고 비효율적이어서 의사 결정에 부정적인 영향을 미쳤습니다. 

해결책: 그들은 Pinecone의 벡터 데이터베이스 기술을 구현하여 데이터 접근을 도왔습니다. Pinecone은 임베딩을 사용하여 방대한 데이터 처리를 간소화하고 더 빠른 통찰력을 제공했습니다.

달성된 결과: 추측해보세요, 솔방울 구현은 여러 면에서 긍정적으로 나타났습니다. 첫째, 플랫폼은 수천 개의 사용 사례를 처리하기 시작했고 수백만 개의 스타트업 프로필을 받았습니다. 이전에는 수동으로 수행되었으므로 99%의 처리 오버헤드 감소 맥락에서 결과는 충격적이었습니다. 

또 다른 장점은 고객이 데이터 세트를 빠르게 탐색하고 매우 효율적으로 의사 결정을 내릴 수 있다는 점인데, 이로 인해 플랫폼이 시장에서 선두 자리를 유지하는 데 도움이 되었습니다.

공식 웹사이트 링크: https://www.pinecone.io/

#2 위비에이트

Weaviate는 오픈소스 벡터 데이터베이스 공급업체이며, 하이브리드 검색을 주요 기능 중 하나로 제공합니다. 이 팀은 80명 이상의 직원으로 빠르게 확장되었으며, 스타트업과 기업 고객 모두에게 서비스를 제공하고 있습니다.  

Weaviate의 하이브리드 검색은 키워드 검색용 희소 벡터와 의미 검색용 밀집 벡터를 모두 사용하여 검색어와 문서의 의미와 맥락을 나타냅니다.

Weaviate의 주요 특징:

  • 향상된 정확도와 관련성을 위해 여러 검색 알고리즘을 결합합니다.
  • 생성적 피드백 루프: 모델에서 생성된 결과를 가져와 벡터화하고 나중에 사용할 수 있도록 데이터베이스에 다시 저장합니다. 이를 통해 AI 애플리케이션의 기능을 향상시킬 수 있는 데이터 생성, 저장 및 검색의 사이클이 생성됩니다.
  • 실시간 처리: 데이터를 가져오거나 수정하는 동안에도 실시간으로 데이터를 검색하고 업데이트할 수 있는 기능
  • 비용 효율적인 아키텍처: 모든 것을 메모리에 보관하지 않고도 대용량 데이터 세트를 관리할 수 있는 기능을 통해 속도와 비용 간의 전략적 균형 유지
  • 유연성: 다양한 프로그래밍 언어 및 GraphQL 쿼리 지원
  • 확장성: 대규모 데이터 세트와 높은 쿼리 볼륨을 처리하기 위해 수평적으로 확장되도록 설계되었습니다.
  • 멀티모달: 텍스트, 이미지 등 다양한 데이터 유형을 처리할 수 있어 다양한 애플리케이션에 활용 가능
  • AI 모델 통합: 다양한 AI 및 머신 러닝 모델과 완벽하게 통합됩니다.

사용 사례:

Weaviate는 주로 챗봇이나 AI 기반 검색 엔진과 같이 문맥적 이해가 필요한 애플리케이션에 적합합니다. Weaviate의 일부 사용 사례는 다음과 같습니다.

  1. 전자상거래 상품 검색:
    • 정확한 키워드 일치 항목을 의미적으로 관련된 항목과 결합하여 제품 검색을 개선합니다.
    • 사용자 경험을 향상시키고 잠재적으로 전환율을 증가시킵니다.
  2. 콘텐츠 추천 시스템:
    • 특정 용어와 전반적인 맥락을 모두 이해하여 더욱 관련성 있는 콘텐츠 제안을 제공합니다.
    • 사용자 참여도와 플랫폼 사용 시간이 증가합니다.
  3. 지식 관리 시스템:
    • 기업 환경에서 보다 효율적인 정보 검색을 용이하게 합니다.
    • 더욱 정확한 검색 결과를 제공하여 직원 생산성을 향상시킵니다.

사례 연구:

도전 과제: Instabase는 하루에 50만 개가 넘는 문서를 처리하는 엔터프라이즈급 AI 애플리케이션 플랫폼입니다. 과제는 매우 명확했는데, 매일 방대한 데이터를 처리하기 때문에 문서 처리 및 이해였습니다. 그들은 선도적인 오픈소스 도구가 제공하는 유연성과 테스트한 다른 데이터베이스보다 Instabase의 중요한 성능 지표를 더 잘 충족하기 때문에 Weaviate를 선택했습니다.

해결책: Instabase는 Weaviate를 사용하여 AI Hub 플랫폼을 구동하고 여러 산업 분야에서 복잡한 데이터 과제를 처리합니다. 

해결책은 Weaviate를 사용하여 데이터 이해를 더 간단하게 만드는 것이었습니다. 모듈형 아키텍처의 통합 능력 덕분에 사용 가능한 데이터를 분류, 검증 및 추출하는 데 도움이 되었으며, 따라서 문서를 적절하게 구조화하고 액세스 가능하게 만들어 더 나은 의사 결정을 내릴 수 있었습니다.

결과: AI 기반 오픈소스 벡터 데이터베이스이기 때문에 검색 관련성과 데이터 추출 속도가 크게 향상되었습니다.

공식 웹사이트 링크: https://weaviate.io/

#3 엘라스틱서치 

Elasticsearch는 다양한 데이터 유형을 처리할 수 있는 인기 있는 오픈소스 검색 엔진 플러그인입니다. 번개처럼 빠른 검색과 미세 조정된 관련성 기능으로 유명합니다. Elasticsearch를 담당하는 회사는 Elastic으로, 2012년부터 오랫동안 설립되어 설립 이후 크게 성장했으며 2018년에 상장되었습니다.

Elasticsearch의 주요 특징:

  • 전체 텍스트 검색 기능: 방대한 양의 텍스트 데이터에서 빠르고 효율적인 검색을 위해 역색인 구조를 활용하여 복잡한 쿼리와 구문 검색을 지원합니다.
  • 확장성: 클러스터 내 여러 노드에 걸쳐 수평적으로 확장할 수 있는 기능
  • 실시간 처리: 실시간에 가까운 검색 및 분석 기능을 제공하여 빠른 데이터 수집 및 즉각적인 검색이 가능합니다.
  • 유연성: RESTful API 및 JSON 지원을 통해 다양한 프로그래밍 언어 및 도구와 쉽게 통합할 수 있습니다.
  • 스키마 프리 및 문서 중심: 미리 정의된 스키마가 필요 없이 유연한 데이터 저장이 가능하고 구조화된 데이터와 구조화되지 않은 데이터를 쉽게 수집할 수 있습니다.
  • 지리공간 지원: 위치 기반 쿼리 및 분석을 효율적으로 처리하는 능력
  • 자동 노드 복구: 노드가 실패하거나 클러스터를 떠날 때 클러스터 상태를 유지하는 데 도움이 되는 내장 기능
  • 클러스터 간 복제: 한 Elasticsearch 클러스터에서 다른 클러스터로 인덱스 복제를 활성화합니다. 재해 복구, 데이터 지역성 및 중앙 보고 시나리오에 유용합니다.
  • 최고 수준의 보안: 다중 테넌시를 지원하고 역할 기반 액세스 제어, 암호화, 감사 로깅을 포함한 강력한 보안 기능을 제공합니다.

사용 사례:

탄력적 검색 플러그인은 전자상거래 웹사이트, 보안 랩, 특히 고급 제품 검색, 추천 엔진, 엔터프라이즈 지식 관리 시스템이 필요한 웹사이트에 가장 적합합니다. 탄력적 검색의 일부 사용 사례는 다음과 같습니다.

  • 지리공간 데이터 검색
  • 로그 및 이벤트 데이터 분석
  • 웹사이트 및 전자상거래 검색엔진
  • 비즈니스 인텔리전스

사례 연구:

과제: 첫 번째이자 가장 중요한 과제는 사용자 기반과 그에 따른 데이터 로그를 늘리는 것이었습니다. Etsy의 로깅 시스템은 스팸을 받았고 느려졌습니다. 엔지니어가 모든 로그를 한곳에 집계하거나 저장할 수 없었기 때문에 데이터를 연관시켜 분석할 수 없었습니다. 그래서 시스템은 보다 진보된 분석 기능을 요구했습니다.

기술: Elastic Search 도구는 이 인프라를 만드는 데 사용되는 주요 기술입니다. 무료는 아니지만 Etsy는 Elastic Search의 클라우드 기반 버전을 사용하기 위해 연간 구독료를 지불했습니다. 최고의 로깅 솔루션 중 하나입니다.

결과: Etsy는 로그 처리를 오프프레미스로 옮겼고, Etsycloud로의 마이그레이션이 개발자에게 가장 좋은 로깅 솔루션을 만들어냈다는 것을 깨달았습니다. 그들은 로그 데이터의 시각적 표현을 만들기 시작했는데, 이는 시스템이 어떻게 작동하는지에 대한 통찰력을 얻는 데 도움이 되었습니다. 마침내 그들은 수년간 찾던 것을 할 수 있었습니다. 로그 데이터에 대한 엄청난 분석입니다.

공식 웹사이트 링크: https://www.elastic.co/elasticsearch

3가지 하이브리드 검색 솔루션 비교 

특징솔방울위비에이트엘라스틱서치
확장성벡터 기반 의미 검색을 전문으로 합니다벡터 임베딩을 사용한 의미 검색 사용전체 텍스트 검색과 고급 하이브리드 검색을 결합합니다.
완성머신 러닝 모델과 원활하게 작동합니다.ML 모델과 잘 통합되며 다양한 데이터 유형을 지원합니다.다양한 데이터 소스 및 외부 도구와 쉽게 통합됩니다.
실시간 검색실시간 고성능 검색을 위해 설계되었습니다.실시간 의미 검색 기능 지원강력한 성능으로 실시간 검색 및 분석 제공
유연성벡터 검색 및 추천 시스템에 중점을 둡니다.다양한 데이터 유형과 사용 사례를 지원합니다복잡한 쿼리 및 세부 필터 가능
고급 기능고차원 벡터 유사성 및 실시간 업데이트에서 최고강력한 의미 검색 및 지식 그래프 기능을 지원합니다.포괄적인 전체 텍스트 검색, 집계 및 필터링에 도움이 됩니다.

결론:

Google이 미국 법무부(DoJ)로부터 더 많은 조사를 받을 것으로 예상됨에 따라 Google 검색 사업을 포함한 나머지 사업에 충격파가 전달될 것입니다. 이는 Perplexity와 같은 새로운 경쟁사와 맞설 수 있도록 새로운 검색 유형의 경험을 더 많이 도입하도록 촉구할 것입니다. 이는 데이터가 지속적으로 증가하고 사용자의 요구 사항이 변함에 따라 기본 키워드 검색을 넘어 하이브리드 검색 솔루션을 제품 스택에 도입하여 복잡한 질의를 처리할 때 사용자 경험을 향상시키고 경쟁력과 관련성을 유지하는 것이 필수적이라는 것을 의미합니다.  

게시자 알렉시스 리
이전 게시물
당신은 또한 좋아할 수 있습니다

댓글을 남겨주세요:

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다