![](https://www.aibusinessasia.com/wp-content/uploads/2024/11/alibaba.png)
Bất chấp lệnh cấm chip từ Hoa Kỳ, hệ sinh thái AI của Trung Quốc đã vượt quá mong đợi, đặc biệt là thu hút sự chú ý của các nhà phát triển quốc tế khi dòng Qwen mã nguồn mở của Alibaba đã được cộng đồng chấp nhận và thảo luận rộng rãi
Trung Quốc đã tạo ra một hệ sinh thái AI hoàn toàn riêng biệt vì nhiều lý do: 1) để giảm sự phụ thuộc vào phương Tây và 2) những hạn chế kiểm duyệt của Vạn lý Tường lửa; nhưng điều đó không có nghĩa là sự đổi mới bị kìm hãm.
Hiện nay, Trung Quốc có rất nhiều công ty hoạt động trong hệ sinh thái AI và hôm nay chúng ta sẽ đi sâu vào vai trò của Alibaba trong lĩnh vực này.
Công ty | Lớp cơ sở hạ tầng | Lớp mô hình | Lớp ứng dụng |
Alibaba | Alibaba Cloud cung cấp cơ sở hạ tầng đám mây mạnh mẽ với khả năng hỗ trợ các mô hình nguồn mở và các dịch vụ AI mở rộng. | Qwen-72B và Qwen-1.8B là các LLM tiên tiến do Alibaba Cloud phát triển, có khả năng xử lý đa phương thức. | Dingtalk, nền tảng trò chuyện doanh nghiệp Alimama, công cụ tối ưu hóa quảng cáo dựa trên AI dành cho các doanh nghiệp vừa và nhỏ bán hàng trên Tmall và Taobao. |
Tencent | Tencent nâng cao khả năng AI của mình thông qua Mạng thông minh hiệu suất cao, tối ưu hóa việc sử dụng GPU cho đào tạo LLM. | Hunyuan là chương trình LLM nội bộ của Tencent hướng đến các ứng dụng doanh nghiệp, tập trung vào hiệu quả và tiết kiệm chi phí. | Các dịch vụ AI của Tencent bao gồm nguồn cấp tin tức được cá nhân hóa và các giải pháp chatbot trên các ứng dụng hiện có. |
Hoa Vi | Huawei Cloud cung cấp cơ sở hạ tầng hiệu suất cao dành riêng cho các ứng dụng AI, tập trung vào tính tự chủ trong công nghệ. | Pangu 3.0 bao gồm các mô hình cơ bản, dành riêng cho ngành và theo tình huống được thiết kế cho nhiều ứng dụng khác nhau trên nhiều lĩnh vực. | Các LLM của Huawei được sử dụng trong nhiều ngành công nghiệp khác nhau như tài chính và chăm sóc sức khỏe để tăng cường nỗ lực chuyển đổi số. |
ByteDance | ByteDance tận dụng cơ sở hạ tầng đám mây của mình để hỗ trợ triển khai các LLM, nhấn mạnh vào hiệu quả chi phí trong các dịch vụ AI. | Doubao là một nhóm LLM do ByteDance ra mắt, được thiết kế cho nhiều ứng dụng khác nhau với chiến lược giá cạnh tranh. | Các ứng dụng như Doubao Chatbot và các công cụ AI tạo sinh khác nhằm mục đích tăng cường tương tác của người dùng và tạo nội dung. |
Baidu | Baidu Cloud cung cấp cơ sở hạ tầng toàn diện cho việc đào tạo và triển khai mô hình AI, tập trung vào những tiến bộ công nghệ trong AI. | Ernie là LLM chủ lực của Baidu, đã chứng kiến sự cải thiện đáng kể về hiệu quả đào tạo và hiệu suất ứng dụng theo thời gian. | Các ứng dụng của Baidu sử dụng Ernie để tăng cường khả năng tìm kiếm, tác nhân đàm thoại và các giải pháp khác dựa trên AI. |
Joe Tsai chia sẻ về chiến lược AI của Alibaba, tập trung vào việc hỗ trợ cơ sở hạ tầng AI bằng cách tận dụng hoạt động kinh doanh đám mây hiện có.
Sổ tay AI của Alibaba
Alibaba đầu tư vào AI theo năm hướng chính với chiến lược song song.
Chiến lược công nghệ toàn diện:
- Xây dựng LLM độc quyền – Qwen và cung cấp LLM của mình cho các nhà xây dựng AI
- Dịch vụ điện toán đám mây
- Thiết kế chip phục vụ cho việc xử lý các ứng dụng AI.
Chiến lược hệ sinh thái:
- Triển khai AI vào các ứng dụng hiện có hướng đến người tiêu dùng
- Tài trợ cho các công ty AI trên toàn hệ sinh thái
Alibaba dễ dàng là công ty công nghệ Trung Quốc nổi tiếng nhất trên thế giới với một doanh nghiệp điện toán đám mây hàng đầu và công nghệ LLM độc quyền của riêng mình. Mặc dù tại Trung Quốc, Baidu và Huawei đều có các mô hình và dịch vụ điện toán đám mây riêng, chiến lược tập trung vào dữ liệu của Baidu luôn tập trung nhiều hơn vào công nghệ lái xe tự động và Huawei luôn tập trung nhiều hơn vào điện toán và phần cứng, trong khi LLM của công ty được coi là tiện ích bổ sung "tốt để có" cho khách hàng doanh nghiệp.
Ngược lại, Alibaba đã nhiều lần tuyên bố rằng mục tiêu của họ là “làm cho AI có thể tiếp cận được với tất cả mọi người”. Tại Hội nghị Apsara năm 2024, Tổng giám đốc điều hành Alibaba Eddie Wu nhấn mạnh rằng công ty cam kết hỗ trợ hệ sinh thái nguồn mở từ chip, máy chủ và mạng đến lưu trữ và trung tâm dữ liệu.
LLM độc quyền: Tongyi Qianwen (Qwen)
Dẫn đầu trong các dịch vụ AI của Alibaba là Tongyi Qianwen, một mô hình ngôn ngữ lớn tương tự như "siêu chatbot". Mô hình tiên tiến này có khả năng hiểu và tạo văn bản, phù hợp với nhiều ứng dụng khác nhau, bao gồm tạo bài viết, phản hồi hội thoại và hỗ trợ khách hàng.
Dòng Qwen – có quy mô đáng kinh ngạc, hiệu suất trên các chuẩn mực, các tính năng đa phương thức và cam kết về khả năng truy cập cho nhiều đối tượng người dùng. Alibaba đã công khai công nghệ này, cho phép các doanh nghiệp khác sử dụng miễn phí để nâng cao khả năng dịch vụ khách hàng của họ.
“Đây là LLM Trung Quốc có tính cạnh tranh cao nhất khi so sánh với các chương trình tương tự như GPT4/4.o về mặt hiệu suất tổng thể”, ông cho biết. Leo Jiang, người sáng lập GroundAI và cựu Giám đốc kỹ thuật số của Huawei.
Ông nói thêm rằng điều làm Qwen trở nên đặc biệt là vì hai định dạng của nó, "dịch vụ LLM do API điều khiển cung cấp thời gian đưa ra thị trường nhanh hơn và tiết kiệm chi phí. Trong khi đó, phiên bản mã nguồn mở cung cấp nhiều quyền kiểm soát và quyền riêng tư hơn cho khách hàng".
Alibaba đã ra mắt công cụ phát triển ngôn ngữ lớn Tongyi Qianwen vào năm 2023 và thường được gọi là Qwen và hiện đang ở phiên bản 2.5. Các mô hình Qwen, bao gồm Qwen-72B và Qwen-1.8B, đáng chú ý vì kích thước tham số đa dạng của chúng—từ 1,8 tỷ đến 72 tỷ tham số—và khả năng đa phương thức của chúng, cho phép chúng xử lý không chỉ văn bản mà còn cả dữ liệu âm thanh và hình ảnh.
Tính linh hoạt này được tăng cường thông qua quá trình đào tạo trên hơn 3 nghìn tỷ mã thông báo, cho phép chúng vượt trội hơn nhiều mô hình nguồn mở khác trên nhiều tiêu chuẩn khác nhau, bao gồm độ chính xác của đa nhiệm và khả năng tạo mã.
Qwen đã định vị mình là một trợ lý AI toàn diện, với năm trường hợp sử dụng ứng dụng chính:
1) biên bản và tóm tắt cuộc họp thời gian thực
2) xử lý nội dung dài và cung cấp các bản tóm tắt đòi hỏi sự hiểu biết phức tạp
3) Tạo bài thuyết trình PowerPoint bằng AI
4) dịch đồng thời thời gian thực
5) trò chuyện video với một tác nhân AI có khả năng giải quyết vấn đề.
Nguồn: Alibaba
Điểm độc đáo của Qwen nằm ở công nghệ ấn tượng và cam kết mạnh mẽ với các nguyên tắc nguồn mở, vì Alibaba cung cấp nhiều phiên bản mô hình khác nhau trên các nền tảng như Hugging Face và ModelScope. Một số người đã thắc mắc tại sao công ty lại chọn mở rộng mô hình của mình cho những người khác khi họ đã đổ vốn vào AI và giờ chỉ trao giải thưởng miễn phí. Tuy nhiên, công ty vẫn kiên quyết làm cho nó dễ tiếp cận với tất cả mọi người vì họ nhấn mạnh rằng cách tiếp cận này thúc đẩy một môi trường hợp tác nơi các nhà phát triển có thể cùng nhau thử nghiệm và đổi mới. Kiếm tiền có thể đến sau và Alibaba chắc chắn sẽ tìm ra cách để làm như vậy, nhưng cho đến nay, công ty đã trở thành một nhân tố chủ chốt trong việc dân chủ hóa quyền truy cập vào các công nghệ AI tiên tiến cho tất cả mọi người.
Alibaba đã đào tạo phần lớn các mô hình AI nguồn mở của mình trên dữ liệu công khai có sẵn trên các ứng dụng của mình như ứng dụng thị trường thương mại điện tử Taobao, một lợi thế cạnh tranh lớn khi số lượng người dùng hoạt động hàng tháng là hơn 930 triệu. Bằng cách mở các mô hình độc quyền của mình, Alibaba đã gây ra một cuộc tranh luận về việc liệu các mô hình AI nguồn mở - thường minh bạch hơn và tiết kiệm chi phí hơn - có thực sự dễ bị lạm dụng hơn không.
Đặc biệt, các công ty có ít hơn 100 triệu người dùng hoạt động hàng tháng có thể sử dụng các mô hình này miễn phí, thúc đẩy việc áp dụng rộng rãi hơn trong các ngành. Bằng cách hỗ trợ sự phát triển của cộng đồng nguồn mở, Alibaba đã hướng đến mục tiêu trao quyền cho người dùng khai thác hiệu quả các khả năng của AI đồng thời giảm sự phụ thuộc vào các công nghệ độc quyền.
Jeff Ding của ChinaAI đã dịch bài viết được lưu hành rộng rãi trên AItechtalk tại sao Qwen là mô hình lớn mã nguồn mở phổ biến nhất thế giới hiện nay, đã viết rằng “theo dữ liệu Hugging Face, dòng/dòng máu Qwen của các mô hình đã đạt tới hơn 50.000. Nghĩa là, các nhà phát triển trên toàn thế giới đã đào tạo hơn 50.000 mô hình phái sinh dựa trên cơ sở dòng Qwen, chỉ đứng sau dòng Llama với khoảng 70.000. Dữ liệu này là chỉ số thuyết phục nhất để đánh giá ảnh hưởng ở cấp độ hệ sinh thái của một mô hình.”
Thật ấn tượng, các mô hình Qwen đã thu hút được sự quan tâm đáng kể từ nhiều lĩnh vực, bao gồm ô tô, trò chơi và nghiên cứu khoa học vào năm ngoái. Các mô hình đã được tải xuống hơn 40 triệu lần kể từ khi ra mắt. Ngoài ra, mô hình Qwen-1.8B nhẹ được thiết kế để triển khai trên các thiết bị biên như điện thoại thông minh, khiến nó trở thành một lựa chọn hấp dẫn cho các ứng dụng yêu cầu tài nguyên tính toán thấp hơn.
Bản nâng cấp toàn diện gần đây nhất của Qwen2.5 có nghĩa là thang đo tham số lớn hơn, khả năng hiểu ảnh và video mạnh mẽ hơn, mô hình ngôn ngữ âm thanh quy mô lớn và các mô hình nguồn mở liên tục. Không chỉ được cải thiện đáng kể mà chi phí cho khả năng suy luận mạnh mẽ để hỗ trợ các tác vụ phức tạp cũng đã giảm đối với cả Qwen-Plus và Qwen-Turbo.
Nhìn về phía trước, CEO Eddie Wu lưu ý rằng trong khi sự phát triển của AI đã tiến triển nhanh chóng, AGI (Trí tuệ nhân tạo tổng quát) vẫn đang trong giai đoạn đầu. Ông nhấn mạnh tầm quan trọng của sự hợp tác và nhấn mạnh rằng chi phí suy luận API cho Tongyi Qianwen đã giảm 97% so với cùng kỳ năm trước, một yếu tố chính góp phần vào sự phổ biến ngày càng tăng của nó. Trên thực tế, điều này đã được xác minh bởi Leo, cựu giám đốc điều hành của Huawei, người đã lưu ý rằng các mô hình Qwen cung cấp độ chính xác và tính thực tế cao hơn so với hầu hết các mô hình khác có trụ sở tại Trung Quốc. Nó có thể được tùy chỉnh cho các trường hợp sử dụng doanh nghiệp ưu tiên độ chính xác của đầu ra và nhằm mục đích giảm thiểu ảo giác mô hình Ngoài ra, Ưu điểm lớn nhất của Qwen hiện nay là cung cấp cho các nhà phát triển một giải pháp thay thế mạnh mẽ nhưng tiết kiệm chi phí.
Làm thế nào để sử dụng Qwen tốt nhất?
Qwen nổi bật là một mô hình ngôn ngữ lớn (LLM) vừa có tính cạnh tranh vừa có tính khả thi về mặt thương mại. Việc áp dụng rộng rãi trong cộng đồng nguồn mở đảm bảo xác thực và hỗ trợ rộng rãi hơn, trong khi việc triển khai được hỗ trợ bởi cơ sở hạ tầng đẳng cấp thế giới từ Alibaba Cloud. Những yếu tố này khiến Qwen trở thành lựa chọn mạnh mẽ cho các doanh nghiệp. Dưới đây là bốn bước chính để hướng dẫn triển khai Qwen cho doanh nghiệp của bạn.
- Xác định mục tiêu kinh doanh và trường hợp sử dụng:Tập trung vào các trường hợp sử dụng có tác động cao, chẳng hạn như tự động hóa hỗ trợ khách hàng, tăng cường phân tích dữ liệu hoặc cải thiện việc tạo nội dung.
- Chuẩn bị dữ liệu và thiết lập cơ sở hạ tầng: Đánh giá và chuẩn bị dữ liệu cần thiết để đào tạo và tinh chỉnh mô hình Qwen. Điều này bao gồm việc dọn dẹp, cấu trúc hóa và đảm bảo tính khả dụng của các tập dữ liệu có liên quan, vì 60–70% tổng chi phí thường nằm ở lớp này.
- Dự án thí điểm và đánh giá lặp lại: Bắt đầu bằng một dự án thí điểm quy mô nhỏ, so sánh kết quả với các KPI được xác định trước và lặp lại nhanh chóng để cải thiện.
- Mở rộng quy mô và tích hợp: Tích hợp hoàn toàn Qwen vào quy trình làm việc hiện tại của bạn để khai thác hết tiềm năng của nó, đồng thời thiết lập cấu trúc quản trị để giám sát và tối ưu hóa hiệu suất.
Đám mây Alibaba
AI và kinh doanh đám mây giống như bàn tay trái và bàn tay phải, Joe Tsai nóina podcast nói chuyện với giám đốc quỹ đầu cơ người Na Uy Nicolai Tangen. Như đã đề cập trước đó, bất kỳ ai cũng có thể sử dụng LLM của Alibaba thông qua API hoặc trực tiếp chuyển sang mô hình mã nguồn mở của nó. Tuy nhiên, bất kỳ ai muốn triển khai Qwen đều cần sức mạnh điện toán đám mây và Alibaba Cloud sẽ cung cấp điều đó.
Trên thực tế, hiện tại, 80% công ty công nghệ của Trung Quốc và một nửa các công ty mô hình lớn của đất nước đang chạy trên Alibaba Cloud. Quy mô này đơn giản là không thể so sánh được. Joe nhắc lại rằng với dịch vụ đám mây là nhà cung cấp lớn nhất tại APAC, Alibaba có lợi thế rất lớn trong việc thu thập dữ liệu và thử nghiệm cho Tongyi Qianwen của mình. Chu kỳ tích cực cho phép hai doanh nghiệp trên các lớp AI liên tục cung cấp cho nhau.
Ngoài ra, công ty đã tạo ra cộng đồng nguồn mở lớn nhất có tên là Phạm vi mô hình nơi lưu trữ nhiều mô hình nguồn mở khác trên thị trường và khi các nhà phát triển sử dụng các mô hình nguồn mở đó, họ cũng sẽ cần sức mạnh tính toán, vốn đã trở thành động lực chính cho doanh thu đám mây của Alibaba.
Bằng cách cung cấp cơ sở hạ tầng đám mây cho các công ty khởi nghiệp, gã khổng lồ công nghệ này hy vọng sẽ bảo vệ được các khoản cược của mình bằng cách cho phép họ truy cập trực tiếp vào ứng dụng tốt nhất hướng đến người tiêu dùng. Việc cung cấp cơ sở hạ tầng đám mây sẽ cho phép công ty truy cập vào một nhóm dữ liệu đa dạng trên nhiều miền và trường hợp sử dụng mà công ty có thể tận dụng để tinh chỉnh các mô hình của riêng mình nếu được cấp phép. Điều này cũng có nghĩa là việc thu hút nhân tài và tiếp xúc với các sáng kiến trong lĩnh vực này sẽ dễ tiếp cận hơn.
Ứng dụng AI của Alibaba
Vậy hãy cùng xem xét mặt trận ứng dụng. Alibaba đã tích hợp AI vào các hoạt động của riêng mình một cách rộng rãi, sử dụng AI để đề xuất sản phẩm trên nền tảng thương mại điện tử, dịch vụ khách hàng thông minh, nhắm mục tiêu quảng cáo được AI hỗ trợ và các giải pháp do AI thúc đẩy trong các dịch vụ đám mây. Ngoài ra, công ty đang tìm cách sử dụng AI tốt hơn để nâng cao hiệu quả hậu cần và các trường hợp sử dụng khác. Hôm nay, trước tiên chúng ta hãy cùng xem qua một vài trường hợp đã phát triển.
Hệ thống phục vụ trực tuyến trí tuệ nhân tạo (AI OS) là một nền tảng do nhóm kỹ thuật tìm kiếm của công ty phát triển. AI OS tích hợp tìm kiếm, đề xuất và quảng cáo được cá nhân hóa, hỗ trợ nhiều tình huống kinh doanh khác nhau trên các nền tảng của Alibaba, chủ yếu tập trung vào các ứng dụng thị trường như Taobao. Công nghệ ban đầu tập trung vào khả năng tìm kiếm của Taobao đã mở rộng để bao gồm các công nghệ học sâu và nhiều công cụ tìm kiếm và đề xuất khác nhau.
Dingtalk là phần mềm trò chuyện doanh nghiệp, tương tự như Slack. Trên toàn bộ Dingtalk, tất cả các sản phẩm đều được tích hợp AI với một tác nhân AI nhúng để sử dụng cho doanh nghiệp và cá nhân, được ra mắt vào đầu năm 2024. Tác nhân AI là một rô-bốt ảo có thể kiểm tra phân tích dữ liệu và được trang bị khả năng ghi nhớ, lập kế hoạch và thực hiện.
Định dạng để tương tác với đại lý là thông qua chatbot tương tự như ChatGPT. Các trường hợp sử dụng được công ty đề xuất bao gồm sử dụng robot làm nhân viên bán hàng, CNTT, hành chính nhân sự, tài chính hoặc nhân viên mua sắm và nó có thể giúp các công ty tự động hóa nhiều nhiệm vụ tẻ nhạt lặp đi lặp lại trong quy trình quản lý.
Trong khi đó, Alimama là một nền tảng giúp các thương hiệu tối ưu hóa quảng cáo trên các ứng dụng thị trường thương mại điện tử của Alibaba – Tmall/Taobao. Alimama là một đơn vị kinh doanh tương đối ít được biết đến của Alibaba nhưng thực tế đã được thành lập rất sớm vào năm 2007. Đây là một nền tảng tiếp thị kỹ thuật số dành cho các doanh nghiệp đang bán hàng trên nền tảng Taobao hoặc Tmall. LMA đa phương tiện hỗ trợ AI đã được ra mắt vào tháng 4 năm nay và hiện đã được áp dụng đầy đủ cho các ứng dụng 2B. Các công cụ bao gồm các đại lý bán hàng AI có khả năng xử lý các yêu cầu của khách hàng và thực hiện các nhiệm vụ thiết kế quảng cáo cơ bản để nâng cao hiệu quả và chất lượng. Ngoài ra, Alimama cung cấp phân tích bán hàng để lập ngân sách và định giá, các công cụ quản lý hàng tồn kho để tăng ROI và các dịch vụ tạo văn bản thành hình ảnh hoặc video tiết kiệm chi phí cho quảng cáo. Công ty tuyên bố đã phục vụ hơn 1 triệu thương gia trên nền tảng này và giảm đáng kể chi phí sản xuất quảng cáo.
Đầu tư để nắm bắt mọi khả năng (Cơ hội)
Alibaba đã tích cực mua lại và đầu tư vào một số công ty AI triển vọng trên nhiều lĩnh vực, đặc biệt là các công ty chuyên về phát triển chip AI và các nhà phát triển LLM. Những động thái chiến lược này nhằm mục đích mở rộng cơ hội của Alibaba trong bối cảnh AI đang phát triển nhanh chóng.
Chỉ tính riêng năm 2024, Alibaba đã dẫn đầu các vòng gọi vốn lớn cho nhiều công ty AI, bao gồm khoản đầu tư $1 tỷ vào Moonshot AI, giúp định giá của công ty này tăng vọt lên khoảng $2,5 tỷ; vòng gọi vốn $691 triệu cho Baichuan, nâng định giá lên khoảng $2,8 tỷ; và cam kết hơn $600 triệu cho MiniMax, là ba trong bốn công ty được gọi là "hổ".
Hiện tại, bốn công ty khởi nghiệp AI có giá trị nhất tại Trung Quốc được mệnh danh là “Bốn chú hổ AI (nhỏ)”, trong khi tất cả chúng đều được thành lập trong vòng ba đến năm năm trở lại đây và đã đạt được thành công to lớn với Moonshot được định giá $3 tỷ, Minimax có giá trị $2 tỷ, Chí Phổ AI huy động gần $800 triệu Và Baichuan được cho là có giá trị gần $2 tỷ.
Chip của Alibaba: T-Head
Cuối cùng và thường bị bỏ qua là những nỗ lực của Alibaba trong việc phát triển phần cứng. Tin tức mới nhất, Huawei không phải là công ty công nghệ lớn duy nhất của Trung Quốc phát triển phần cứng chip.
Dự án sản xuất chip của Alibaba, Đầu chữ T, đang có những bước tiến đáng kể trong quá trình phát triển kiến trúc RISC-V như một phần trong nỗ lực rộng lớn hơn của Trung Quốc nhằm tự cung tự cấp chất bán dẫn trong bối cảnh các hạn chế thương mại đang diễn ra của Hoa Kỳ. T-Head đã tập trung vào việc tạo ra các chip hiệu suất cao có thể hỗ trợ nhiều ứng dụng khác nhau, bao gồm trí tuệ nhân tạo (AI), phân tích dữ liệu lớn và giao dịch trực tuyến.
Một trong những sản phẩm đáng chú ý của T-Head là Zhenyue 510, một chip điều khiển được thiết kế cho ổ đĩa thể rắn (SSD) doanh nghiệp. Được ra mắt tại hội nghị điện toán đám mây Apsara của Alibaba, con chip này hứa hẹn sẽ nâng cao hiệu suất trong các trung tâm dữ liệu của Alibaba Cloud bằng cách giảm độ trễ 30% cho các hoạt động đầu vào và đầu ra so với các giải pháp hiện có. Sự đổi mới này rất quan trọng vì nó cho phép Alibaba tối ưu hóa các dịch vụ đám mây của mình và cải thiện hiệu quả trong việc xử lý các tác vụ xử lý dữ liệu quy mô lớn.
Trong khi Trung Quốc tiếp tục hạn chế công nghệ của Hoa Kỳ, việc T-Head tập trung vào RISC-V thể hiện động thái chiến lược hướng tới khả năng độc lập lớn hơn trong thiết kế và sản xuất chip.
Những gì chúng ta biết là Alibaba đã áp dụng một cách tiếp cận toàn diện cho chiến lược AI của mình. Nó bao gồm một ngăn xếp công nghệ toàn diện và đã định vị mình là một bên chủ chốt trong hệ sinh thái, tất cả đều là nền tảng chính để thúc đẩy đáng kể hơn nữa các mô hình Qwen. Được xây dựng trên nền tảng khả năng mở rộng ở cấp độ cơ sở hạ tầng, xuống đến cấp độ chip, các mô hình Qwen được thiết kế để hỗ trợ các ứng dụng đa dạng trên toàn bộ hệ sinh thái thương mại điện tử, ứng dụng và đầu tư rộng lớn của Alibaba. Trọng tâm chiến lược này không chỉ nâng cao khả năng của các mô hình mà còn đảm bảo tính phù hợp và hiệu quả của chúng trong nhiều trường hợp sử dụng do doanh nghiệp thúc đẩy, ưu tiên độ chính xác và giảm thiểu ảo giác mô hình. Công ty đã thành công trong việc định vị mình là một trong những công ty quan trọng nhất, nếu không muốn nói là QUAN TRỌNG NHẤT, trong hệ sinh thái AI của Trung Quốc.
##
Nguồn: phỏng vấn, báo cáo ngành, hiểu biết chuyên sâu của chuyên gia, thông báo của công ty, tài liệu quan hệ nhà đầu tư, biên bản từ Hội nghị Aspara và Alizila.
Liên kết
- Đám mây Alibaba liên kết chính thức đến Qwen
- Hướng dẫn Qwen2.5-LLM, cập nhật lần cuối vào tháng 9 năm 2024
- Github Qwen2.5: một loạt các mô hình ngôn ngữ lớn hỗ trợ nhiều thang tham số (từ 0,5B đến 72B), với khả năng cải thiện trong việc tạo văn bản dài, theo dõi hướng dẫn và hiểu dữ liệu có cấu trúc, và hỗ trợ 29 ngôn ngữ. Các ứng dụng của nó phù hợp để tạo mã, tạo văn bản và xử lý dữ liệu phức tạp. Qwen2.5 cung cấp các tính năng như lượng tử hóa, suy luận và triển khai cục bộ, tương thích với nhiều khuôn khổ tính toán khác nhau, chẳng hạn như Hugging Face, ModelScope và vLLM, cùng nhiều tính năng khác.
- Github Qwen-VL: là một mô hình ngôn ngữ trực quan quy mô lớn hỗ trợ cả đầu vào hình ảnh và văn bản và có khả năng hội thoại đa ngôn ngữ, đặc biệt xuất sắc trong nhận dạng hình ảnh-văn bản tiếng Trung và tiếng Anh. Mô hình hỗ trợ xử lý hình ảnh có độ phân giải cao và nhận dạng chi tiết, vượt trội hơn hầu hết các mô hình nguồn mở.
- Github Qwen-Âm thanh: có khả năng xử lý nhiều đầu vào âm thanh khác nhau (như giọng nói của con người, âm thanh tự nhiên, âm nhạc, v.v.) và tạo ra đầu ra văn bản. Mô hình này phù hợp cho các tác vụ như nhận dạng âm thanh, mô tả âm thanh, phân loại cảnh và nhận dạng cảm xúc.
- Github Qwen2.5-Toán: hỗ trợ giải quyết các bài toán bằng cả tiếng Trung và tiếng Anh và tích hợp Chuỗi tư duy (CoT) và Lý luận tích hợp công cụ (TIR).
- Github Qwen2.5-Người lập trình: mô hình lập trình nguồn mở mới nhất hỗ trợ cửa sổ ngữ cảnh 128K và bao gồm 92 ngôn ngữ lập trình.
Tiểu sử tác giả
Grace viết về AI x Năng lượng, AI x Địa chính trị, AI x bigtech trên Substack tại AI Proem.
Cô ấy cũng thường viết bình luận cho Vận may, Nhà ngoại giaovà các ấn phẩm quốc tế khác về AI, công nghệ và quản trị doanh nghiệp. Trong quá khứ làm nhà báo, Grace đã tường thuật cho CNBC về công nghệ và kinh doanh châu Á tại Singapore, và tác phẩm của cô cũng đã được xuất bản trên SCMP, S&P Global Market Intelligence, Yahoo Finance và USA Today.
5 tác phẩm được đọc nhiều nhất của Grace:
- Cuộc chạy đua vũ trang AI vẫn chưa kết thúc: chip chỉ là một nửa trò chơi, và cơ sở hạ tầng là phần còn lại
- Tại sao các trung tâm dữ liệu chưa thể chuyển sang sử dụng năng lượng tái tạo hoàn toàn
- Thu nhập của Big Tech: Tất cả cùng chung tay vì AI
- Baidu, Alibaba, Tencent: Cuộc chiến trí tuệ nhân tạo
- Một thế giới hạt nhân hoàn toàn mới
Cuộc chiến sâu sắc tiếp theo sắp diễn ra: Huawei so với Nvidia và Google
Đăng ký để nhận thông tin cập nhật bài viết mới nhất trên blog
Để lại bình luận của bạn: