Hoạt động tìm kiếm của Google là Cuối cùng đối đầu với một đối thủ thực sự.

Một công ty tìm kiếm AI mới có tên Perplexity, tập trung vào việc xây dựng và mở rộng kiến thức, đã đạt 10 triệu người dùng hoạt động hàng tháng (MAU) vào đầu năm 2024, đạt tốc độ tăng trưởng hàng tháng đáng kinh ngạc là hơn 40%.

Tính đến thời điểm bài viết này được viết, MAU của nó có thể nằm trong khoảng từ 40M đến 50M. So với MAU tìm kiếm của Google, nó vẫn còn rất nhỏ. Tuy nhiên, điều thực sự hứa hẹn là trải nghiệm tìm kiếm mới mà nó cung cấp, nó không chỉ tập trung vào những gì bạn biết, ví dụ như trả về kết quả dựa trên tìm kiếm từ khóa, mà còn mở rộng kiến thức của bạn khi bạn không chắc chắn nên tìm kiếm gì, ví dụ như không biết từ khóa để tìm kiếm. 

Tính năng này được hỗ trợ bởi tìm kiếm kết hợp. 

Tìm kiếm kết hợp là gì?

Tìm kiếm kết hợp là một kỹ thuật tìm kiếm nâng cao kết hợp sức mạnh của tìm kiếm từ khóa truyền thống (dựa trên từ khóa) với khả năng tìm kiếm ngữ nghĩa hiện đại (dựa trên ý định). 

Kết quả của công cụ tìm kiếm chủ yếu phụ thuộc vào việc khớp từ khóa. Ví dụ, nếu bạn tìm kiếm điện thoại thông minh tốt nhất có camera độ nét cao, tìm kiếm từ khóa truyền thống chỉ hiển thị kết quả với các từ khóa có "điện thoại thông minh" và "camera độ nét cao" nhưng bạn có thể bỏ lỡ thông tin như đánh giá, so sánh và các thông tin chi tiết cụ thể theo ngữ cảnh khác như hiệu suất ánh sáng yếu, khả năng quay video, v.v.

Tuy nhiên, tìm kiếm ngữ nghĩa hiểu được ý định của bạn khi mua điện thoại thông minh nhưng bạn có thể đạt được kết quả chính xác hơn và một bộ kết quả toàn diện bằng cách kết hợp tìm kiếm từ khóa và tìm kiếm ngữ nghĩa. Và đây chính là tìm kiếm kết hợp.

Tại sao tìm kiếm kết hợp lại quan trọng vào năm 2024?

Bạn có biết ngay cả các công ty thương mại điện tử hàng đầu như Amazon và eBay cũng sử dụng thuật toán tìm kiếm kết hợp để có các đề xuất tốt hơn và cải thiện trải nghiệm không? Về mặt khởi nghiệp, họ di chuyển thậm chí còn nhanh hơn. Ví dụ, công ty khởi nghiệp Moonsift có trụ sở tại Vương quốc Anh đang tận dụng tìm kiếm kết hợp để giúp người mua sắm trực tuyến khám phá các sản phẩm họ yêu thích. Mặt Trăng cung cấp tiện ích mở rộng trình duyệt thương mại điện tử cho phép người dùng quản lý các bảng mua sắm với các sản phẩm từ khắp internet và điều này rất quan trọng để cung cấp cho người dùng kết quả hoặc dịch vụ chính xác mà họ mong muốn. 

Việc mang đến cho người dùng trải nghiệm hoàn hảo và khiến họ cảm thấy được thấu hiểu là điều cần thiết, và đó là lý do tại sao tìm kiếm kết hợp lại quan trọng vào năm 2024. 

Các giải pháp tìm kiếm kết hợp hàng đầu năm 2024

Có rất nhiều công cụ tìm kiếm lai có sẵn trên thị trường. Dưới đây chúng tôi đã nghiên cứu ba công cụ hàng đầu giải pháp tìm kiếm kết hợp mà bạn sẽ thấy đáng để thử.

#1 Quả thông

Nền tảng Pinecone là cơ sở dữ liệu vector dựa trên đám mây được thiết kế cho các ứng dụng tìm kiếm. Nó kết hợp tìm kiếm vector với các từ khóa và bộ lọc siêu dữ liệu quen thuộc để có được kết quả mới nhất và có liên quan. Nó cung cấp giao diện API người dùng cho khả năng tìm kiếm ngữ nghĩa và đa phương thức cũng như các dịch vụ tạo ứng viên. Việc tạo ra các giải pháp AI trở nên đơn giản với cơ sở hạ tầng không rắc rối của nó. 

Các tính năng chính của Pinecone

  • Giải pháp trọn gói: Kết hợp tìm kiếm từ khóa và tìm kiếm ngữ nghĩa trong một hệ thống duy nhất, đơn giản hóa việc triển khai và quản lý.
  • Mức độ liên quan có thể tùy chỉnh: Dễ dàng điều chỉnh sự cân bằng giữa các kết quả khớp chính xác và các khái niệm liên quan để phù hợp với nhu cầu kinh doanh của bạn.
  • Ứng dụng đa năng: Hoạt động trên nhiều loại nội dung khác nhau bao gồm văn bản, hình ảnh và âm thanh, phù hợp với nhiều trường hợp sử dụng kinh doanh khác nhau.
  • Khả năng mở rộng: Xử lý khối lượng dữ liệu lớn một cách hiệu quả, phát triển cùng doanh nghiệp của bạn mà không gặp vấn đề về hiệu suất.
  • Thân thiện với người dùng: Tích hợp liền mạch với các hệ thống hiện có thông qua API đơn giản, giảm độ phức tạp về mặt kỹ thuật.
  • Độ chính xác được cải thiện: Nâng cao độ chính xác của tìm kiếm bằng cách xem xét cả các thuật ngữ cụ thể và bối cảnh tổng thể, mang lại trải nghiệm tốt hơn cho người dùng.
  • Hiệu quả về mặt chi phí: Loại bỏ nhu cầu sử dụng nhiều giải pháp tìm kiếm, có khả năng giảm chi phí vận hành và tính phức tạp.
  • Có thể thích nghi: Hỗ trợ nhiều mô hình tìm kiếm theo tiêu chuẩn công nghiệp, cho phép triển khai linh hoạt dựa trên các yêu cầu kinh doanh cụ thể.

Các trường hợp sử dụng:

Pinecone hữu ích trong việc cung cấp các đề xuất được cá nhân hóa, tìm kiếm tương tự theo thời gian thực và tạo các ứng dụng AI đòi hỏi khả năng tìm kiếm nhanh và chính xác. Một số trường hợp sử dụng pinecones là: 

  • Tìm kiếm sản phẩm thương mại điện tử: Cải thiện khả năng khám phá và mức độ liên quan của sản phẩm.
  • Trả lời câu hỏi về miền mở: Nâng cao độ chính xác trong các câu hỏi kiến thức chung.
  • Chatbot theo ngữ cảnh: Cung cấp phản hồi phù hợp hơn trong AI đàm thoại.
  • Trải nghiệm tìm kiếm được cá nhân hóa: Điều chỉnh kết quả dựa trên sở thích và hành vi của người dùng.
  • Thu hồi tăng cường thế hệ (RAG): Cải thiện kết quả đầu ra của mô hình ngôn ngữ bằng cách thu thập thông tin có liên quan.
  • Tìm kiếm doanh nghiệp: Cải thiện khả năng truy xuất thông tin trên nhiều dữ liệu doanh nghiệp khác nhau.
  • Hệ thống đề xuất nội dung: Gợi ý nội dung có liên quan cho người dùng.

Nghiên cứu tình huống:

Hãy cùng khám phá nghiên cứu điển hình về cách Pinecone đã giúp Entrapeer thành công.

Thách thức: Entrapeer là một nền tảng có hơn 200.000 trường hợp sử dụng và hơn 3 triệu hồ sơ khởi nghiệp, đã gặp phải thách thức với khối lượng dữ liệu xử lý. Người dùng khó có thể có được thông tin chi tiết nhanh chóng và điều hướng các tập dữ liệu cực kỳ phức tạp. Quá trình khám phá tốn thời gian và không hiệu quả, ảnh hưởng tiêu cực đến việc ra quyết định. 

Giải pháp: Họ đã triển khai công nghệ cơ sở dữ liệu vector của Pinecone để hỗ trợ truy cập dữ liệu. Bằng cách sử dụng nhúng, Pinecone đã đơn giản hóa quá trình xử lý dữ liệu lớn và cung cấp thông tin chi tiết nhanh hơn.

Kết quả đạt được: Đoán xem, việc triển khai pinecone hóa ra lại tích cực theo nhiều cách khác nhau. Đầu tiên, nền tảng bắt đầu xử lý hàng nghìn trường hợp sử dụng và nhận được hàng triệu hồ sơ khởi động. Trước đây, việc này được thực hiện thủ công, vì vậy kết quả thật đáng kinh ngạc trong bối cảnh chi phí xử lý giảm xuống còn 99%. 

Những điểm cộng khác là khả năng điều hướng nhanh chóng các tập dữ liệu của khách hàng và khả năng ra quyết định hiệu quả cao giúp nền tảng này tiếp tục dẫn đầu thị trường.

Liên kết trang web chính thức: https://www.pinecone.io/

#2 Hàng không

Weaviate là nhà cung cấp cơ sở dữ liệu vector mã nguồn mở và cung cấp Tìm kiếm lai như một trong những tính năng chính. Nhóm đã mở rộng nhanh chóng lên hơn 80 nhân viên và phục vụ cả khách hàng khởi nghiệp và doanh nghiệp.  

Tìm kiếm kết hợp của Weaviate sử dụng cả vectơ thưa (để tìm kiếm từ khóa) và vectơ dày đặc (để tìm kiếm ngữ nghĩa) để biểu diễn ý nghĩa và bối cảnh của truy vấn tìm kiếm và tài liệu.

Các tính năng chính của Weaviate:

  • Kết hợp nhiều thuật toán tìm kiếm để cải thiện độ chính xác và tính liên quan
  • Vòng phản hồi tạo ra: Lấy kết quả được tạo ra từ các mô hình, vector hóa chúng và lưu chúng trở lại cơ sở dữ liệu để sử dụng trong tương lai. Điều này tạo ra một chu kỳ tạo, lưu trữ và truy xuất dữ liệu có thể nâng cao khả năng của các ứng dụng AI
  • Xử lý thời gian thực: Khả năng tìm kiếm và cập nhật dữ liệu theo thời gian thực, ngay cả khi dữ liệu đang được nhập hoặc sửa đổi
  • Kiến trúc tiết kiệm chi phí: Cân bằng chiến lược giữa tốc độ và chi phí, với khả năng quản lý các tập dữ liệu lớn mà không cần lưu trữ mọi thứ trong bộ nhớ
  • Tính linh hoạt: Hỗ trợ nhiều ngôn ngữ lập trình và truy vấn GraphQL
  • Khả năng mở rộng: Được thiết kế để mở rộng theo chiều ngang nhằm xử lý các tập dữ liệu lớn và khối lượng truy vấn cao
  • Đa phương thức: Có khả năng xử lý nhiều loại dữ liệu, bao gồm văn bản, hình ảnh, v.v., giúp nó linh hoạt cho nhiều ứng dụng khác nhau
  • Tích hợp mô hình AI: Tích hợp liền mạch với nhiều mô hình AI và máy học khác nhau

Các trường hợp sử dụng:

Weaviate chủ yếu phù hợp với các ứng dụng cần hiểu biết theo ngữ cảnh như chatbot hoặc công cụ tìm kiếm do AI điều khiển. Một số trường hợp sử dụng của Weaviate là:

  1. Tìm kiếm sản phẩm thương mại điện tử:
    • Cải thiện khả năng khám phá sản phẩm bằng cách kết hợp các từ khóa khớp chính xác với các mục có liên quan về mặt ngữ nghĩa
    • Nâng cao trải nghiệm của người dùng và có khả năng tăng tỷ lệ chuyển đổi
  2. Hệ thống đề xuất nội dung:
    • Cung cấp các gợi ý nội dung có liên quan hơn bằng cách hiểu cả các thuật ngữ cụ thể và bối cảnh chung
    • Tăng sự tham gia của người dùng và thời gian dành cho nền tảng
  3. Hệ thống quản lý kiến thức:
    • Tạo điều kiện thuận lợi cho việc truy xuất thông tin hiệu quả hơn trong môi trường doanh nghiệp
    • Cải thiện năng suất của nhân viên bằng cách cung cấp kết quả tìm kiếm chính xác hơn

Nghiên cứu tình huống:

Thách thức: Instabase là một nền tảng ứng dụng AI cấp doanh nghiệp, xử lý hơn 500 nghìn tài liệu mỗi ngày. Thách thức khá rõ ràng, đó là xử lý và hiểu tài liệu vì nó xử lý lượng dữ liệu khổng lồ mỗi ngày. Họ chọn Weaviate vì tính linh hoạt mà một công cụ nguồn mở hàng đầu mang lại cho họ trong khi vẫn đạt được các số liệu hiệu suất quan trọng của Instabase tốt hơn bất kỳ cơ sở dữ liệu nào khác mà họ đã thử nghiệm.

Giải pháp:Instabase sử dụng Weaviate để hỗ trợ nền tảng AI Hub của họ và xử lý các thách thức dữ liệu phức tạp trên nhiều ngành. 

Giải pháp là sử dụng Weaviate để giúp hiểu dữ liệu đơn giản hơn. Nhờ khả năng tích hợp của kiến trúc mô-đun, nó giúp phân loại, xác thực và trích xuất dữ liệu có thể sử dụng, do đó làm cho tài liệu có cấu trúc và khả năng truy cập phù hợp, đồng thời cho phép đưa ra quyết định tốt hơn.

Kết quả:Là cơ sở dữ liệu vector nguồn mở dựa trên AI, nó cải thiện đáng kể tính liên quan của tìm kiếm và tốc độ trích xuất dữ liệu.

Liên kết trang web chính thức: https://weaviate.io/

Tìm kiếm đàn hồi #3 

Elasticsearch là một plugin công cụ tìm kiếm nguồn mở phổ biến có khả năng xử lý nhiều loại dữ liệu khác nhau. Nó được biết đến với khả năng tìm kiếm cực nhanh và khả năng liên quan được tinh chỉnh. Công ty đứng sau Elasticsearch là Elastic, được thành lập từ năm 2012 đã phát triển đáng kể kể từ khi thành lập và lên sàn vào năm 2018.

Các tính năng chính của Elasticsearch:

  • Khả năng tìm kiếm toàn văn: Tận dụng cấu trúc chỉ mục đảo ngược để tìm kiếm nhanh chóng và hiệu quả trên khối lượng dữ liệu văn bản lớn, hỗ trợ các truy vấn phức tạp và tìm kiếm cụm từ.
  • Khả năng mở rộng: Khả năng mở rộng theo chiều ngang trên nhiều nút trong một cụm
  • Xử lý thời gian thực: cung cấp khả năng tìm kiếm và phân tích gần như thời gian thực, cho phép thu thập dữ liệu nhanh chóng và khả năng tìm kiếm ngay lập tức
  • Tính linh hoạt: Hỗ trợ RESTful API và JSON giúp dễ dàng tích hợp với nhiều ngôn ngữ lập trình và công cụ khác nhau
  • Không cần lược đồ và hướng đến tài liệu: Cho phép lưu trữ dữ liệu linh hoạt mà không cần lược đồ được xác định trước và dễ dàng thu thập dữ liệu có cấu trúc và không có cấu trúc
  • Hỗ trợ không gian địa lý: Khả năng xử lý các truy vấn và phân tích dựa trên vị trí một cách hiệu quả
  • Tự động khôi phục nút: Tính năng tích hợp giúp duy trì tình trạng cụm khi các nút bị lỗi hoặc rời khỏi cụm
  • Sao chép giữa các cụm: Cho phép sao chép các chỉ mục từ cụm Elasticsearch này sang cụm Elasticsearch khác; hữu ích cho việc phục hồi sau thảm họa, vị trí dữ liệu và các tình huống báo cáo tập trung
  • Bảo mật hàng đầu: Hỗ trợ nhiều bên thuê và cung cấp các tính năng bảo mật mạnh mẽ, bao gồm kiểm soát truy cập dựa trên vai trò, mã hóa và ghi nhật ký kiểm tra

Các trường hợp sử dụng:

Plugin tìm kiếm đàn hồi phù hợp nhất với các trang web thương mại điện tử, phòng thí nghiệm bảo mật và đặc biệt là những trang web cần tìm kiếm sản phẩm nâng cao, công cụ đề xuất và hệ thống quản lý kiến thức doanh nghiệp. Một số trường hợp sử dụng tìm kiếm đàn hồi là:

  • Tìm kiếm dữ liệu không gian địa lý
  • Phân tích dữ liệu sự kiện và nhật ký
  • Công cụ tìm kiếm trang web và thương mại điện tử
  • Trí tuệ kinh doanh

Nghiên cứu tình huống:

Thách thức: Thách thức đầu tiên và quan trọng nhất là tăng cơ sở người dùng và nhật ký dữ liệu đi kèm. Hệ thống ghi nhật ký của Etsy nhận được thư rác và trở nên chậm. Vì các kỹ sư không thể tổng hợp hoặc lưu trữ tất cả nhật ký ở một nơi nên họ không thể liên kết dữ liệu để có được phân tích. Vì vậy, hệ thống đòi hỏi khả năng phân tích nâng cao hơn.

Công nghệ: Công cụ tìm kiếm đàn hồi là công nghệ chính được sử dụng để tạo ra cơ sở hạ tầng này. Nó không miễn phí nhưng Etsy đã trả phí đăng ký hàng năm để sử dụng phiên bản dựa trên đám mây của Elastic Search. Là một trong những giải pháp ghi nhật ký tốt nhất.

Kết quả: Etsy đã di chuyển quá trình xử lý nhật ký ra khỏi cơ sở và họ nhận ra rằng việc di chuyển sang Etsycloud đã tạo ra giải pháp ghi nhật ký tốt nhất cho các nhà phát triển của mình. Họ bắt đầu tạo các biểu diễn trực quan về dữ liệu nhật ký của mình, giúp hiểu rõ hơn về cách hệ thống của họ đang hoạt động. Cuối cùng, họ đã có thể làm được điều mà họ đã tìm kiếm trong nhiều năm - một phân tích tuyệt vời về dữ liệu nhật ký của họ.

Liên kết trang web chính thức: https://www.elastic.co/elasticsearch

So sánh 3 giải pháp tìm kiếm kết hợp 

Đặc trưngQuả thôngDệt bằng máy bayTìm kiếm đàn hồi
Khả năng mở rộngChuyên về tìm kiếm ngữ nghĩa dựa trên vectorSử dụng tìm kiếm ngữ nghĩa với nhúng vectorKết hợp tìm kiếm toàn văn bản với lai nâng cao
Tích hợpHoạt động liền mạch với các mô hình học máyTích hợp tốt với các mô hình ML và hỗ trợ nhiều loại dữ liệu khác nhauDễ dàng tích hợp với nhiều nguồn dữ liệu và công cụ bên ngoài
Tìm kiếm thời gian thựcĐược thiết kế cho tìm kiếm hiệu suất cao theo thời gian thựcHỗ trợ khả năng tìm kiếm ngữ nghĩa theo thời gian thựcCung cấp tìm kiếm và phân tích thời gian thực với hiệu suất mạnh mẽ
Tính linh hoạtTập trung vào hệ thống tìm kiếm và đề xuất vectorHỗ trợ nhiều loại dữ liệu và trường hợp sử dụngCó khả năng thực hiện các truy vấn phức tạp và lọc chi tiết
Tính năng nâng caoTốt nhất trong tính tương đồng vectơ chiều cao và cập nhật thời gian thựcHỗ trợ chức năng tìm kiếm ngữ nghĩa mạnh mẽ và đồ thị kiến thứcGiúp tìm kiếm toàn văn bản, tổng hợp và lọc

Phần kết luận:

Dự đoán Google sẽ phải đối mặt với nhiều sự giám sát hơn từ Bộ Tư pháp Hoa Kỳ (DoJ), điều này sẽ gây chấn động đến các hoạt động kinh doanh còn lại của công ty, bao gồm cả hoạt động kinh doanh tìm kiếm của Google. Điều này sẽ thúc đẩy việc áp dụng nhiều hơn các loại trải nghiệm tìm kiếm mới để phù hợp với các đối thủ cạnh tranh mới như Perplexity. Điều này có ý nghĩa đối với thế giới là trong khi dữ liệu liên tục tăng lên và nhu cầu của người dùng thay đổi, điều cần thiết là phải vượt ra ngoài các tìm kiếm từ khóa cơ bản và áp dụng các giải pháp tìm kiếm kết hợp vào ngăn xếp sản phẩm của bạn, để nâng cao trải nghiệm của người dùng khi giải quyết các truy vấn phức tạp và duy trì tính cạnh tranh và sự phù hợp.  

Đăng bởi Alexis Lý
BÀI VIẾT TRƯỚC
Bạn cũng có thể thích

Để lại bình luận của bạn:

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *