米国によるチップ禁止にもかかわらず、中国のAIエコシステムは期待を上回り、特にアリババのオープンソースQwenシリーズがコミュニティで広く採用され議論されているため、開発者から国際的な注目を集めています。
中国は、1) 西側諸国への依存を減らすため、2) グレートファイアウォールによる検閲の制約など、さまざまな理由から、完全に独立した AI エコシステムを構築してきましたが、だからといってイノベーションが抑制されているわけではありません。
現在、中国には AI エコシステム全体にわたって非常に活発なプレーヤーが存在します。本日は、この分野で Alibaba が果たしている役割について詳しく見ていきます。
会社 | インフラストラクチャ層 | モデルレイヤー | アプリケーション層 |
アリババ | Alibaba Cloud は、オープンソース モデルと広範な AI サービスをサポートする堅牢なクラウド インフラストラクチャを提供します。 | Qwen-72B と Qwen-1.8B は、マルチモーダル処理機能を備えた Alibaba Cloud によって開発された高度な LLM です。 | Dingtalk、エンタープライズ チャット プラットフォーム Alimama、Tmall と Taobao で販売する中小企業向けの AI 駆動型広告最適化ツール セット。 |
テンセント | Tencent は、インテリジェントな高性能ネットワークを通じて AI 機能を強化し、LLM トレーニングの GPU 使用を最適化します。 | Hunyuan は、効率性とコスト効率に重点を置いた、エンタープライズ アプリケーションを対象とした Tencent の社内 LLM です。 | テンセントのAIサービスには以下が含まれる。 既存のアプリ全体でパーソナライズされたニュースフィードとチャットボット ソリューションを提供します。 |
ファーウェイ | Huawei Cloud は、テクノロジーの自立性を重視し、AI アプリケーション向けにカスタマイズされた高性能なインフラストラクチャを提供します。 | Pangu 3.0 は、さまざまなセクターのさまざまなアプリケーション向けに設計された、基礎モデル、業界固有モデル、シナリオ固有モデルで構成されています。 | Huawei の LLM は、金融やヘルスケアなどのさまざまな業界でデジタル変革の取り組みを強化するために使用されています。 |
バイトダンス | ByteDance は、クラウド インフラストラクチャ ハブを活用して LLM の展開をサポートし、AI サービスのコスト効率を重視しています。 | Doubao は、ByteDance が立ち上げた LLM ファミリーであり、積極的な価格戦略でさまざまなアプリケーション向けに設計されています。 | Doubao Chatbot などのアプリケーションやその他の生成 AI ツールは、ユーザー インタラクションとコンテンツ生成を強化することを目的としています。 |
百度 | Baidu Cloud は、AI の技術的進歩に重点を置き、AI モデルのトレーニングと展開のための包括的なインフラストラクチャを提供します。 | Ernie は Baidu の主力 LLM であり、時間の経過とともにトレーニングの効率とアプリケーション パフォーマンスが大幅に向上しました。 | Baidu のアプリケーションでは、検索機能の強化、会話エージェント、その他の AI 駆動型ソリューションに Ernie が活用されています。 |
Joe Tsai 氏は、既存のクラウド ビジネスを活用して AI インフラストラクチャをサポートすることに重点を置いた Alibaba の AI 戦略について語ります。
アリババの AI プレイブック
アリババは、2つの戦略に基づいて5つの主要な方法で AI に投資しています。
エンドツーエンドの技術スタック戦略:
- 独自のLLMであるQwenを構築し、AI開発者にLLMを提供する
- クラウドコンピューティングサービス
- AI アプリケーションの処理に特化したチップの設計。
エコシステム戦略:
- 既存の消費者向けアプリケーションにAIを実装する
- エコシステム全体にわたるAI企業への資金提供
Alibaba は、業界をリードするクラウド ビジネスと独自の LLM 技術を持つ、国際的に最もよく知られている中国のテクノロジー企業です。中国では、Baidu と Huawei がそれぞれ独自のモデルとクラウド サービスを持っていますが、Baidu のデータ重視の戦略は常に自動運転技術に重点を置いており、Huawei は常にコンピューティングとハードウェアに重点を置いています。一方、同社の LLM は、エンタープライズ クライアントにとって「あれば便利な」追加機能とみなされています。
対照的に、アリババは「AIをすべての人が利用できるようにすること」を目指していると繰り返し述べている。 2024年のアプサラ会議では、 アリババのCEO、エディ・ウー氏は、同社がチップ、サーバー、ネットワークからストレージ、データセンターに至るまでオープンソースのエコシステムをサポートすることに注力していると強調した。
独自の LLM: Tongyi Qianwen (Qwen)
Alibaba の AI 製品の最前線にあるのが、「スーパー チャットボット」に似た大規模言語モデルである Tongyi Qianwen です。この高度なモデルはテキストを理解して生成できるため、記事の作成、会話の応答、顧客サポートなど、幅広いアプリケーションに適しています。
Qwen シリーズは、驚異的なスケール、ベンチマークを越えたパフォーマンス、マルチモーダル機能、幅広いユーザーへのアクセシビリティへの取り組みを備えています。Alibaba はこのテクノロジーを一般公開しており、他の企業が無料で利用して顧客サービス機能を強化できるようにしています。
「総合的なパフォーマンスの点で、GPT4/4.oなどと比較すると、最も競争力のある中国のLLMです」と、 GroundAIの創設者であり、元Huaweiの最高デジタル責任者であるLeo Jiang氏。
彼はさらに、Qwen が特別なのは 2 つの形式を備えているためだと付け加えました。「API 駆動型の LLM サービスは、市場投入までの時間を短縮し、コスト効率を高めます。一方、オープンソース バージョンは、クライアントにより多くの制御とプライバシーを提供します。」
アリババは2023年に大規模な言語開発ツールTongyi Qianwenをリリースしました。これはQwenとも呼ばれ、現在は2.5イテレーションになっています。Qwen-72BやQwen-1.8BなどのQwenモデルは、18億から720億のパラメータに及ぶ多様なパラメータサイズと、テキストだけでなく音声や映像データも処理できるマルチモーダル機能で知られています。
この柔軟性は、3 兆を超えるトークンでのトレーニングによって強化され、マルチタスクの精度やコード生成機能など、さまざまなベンチマークで他の多くのオープンソース モデルを上回るパフォーマンスを実現します。
Qwen は、5 つの主要なアプリケーション使用例を備えた、オールラウンドな AI アシスタントとしての地位を確立しています。
1) リアルタイムの会議の文字起こしと要約
2) 長いコンテンツを処理し、複雑な理解を必要とする要約を提供する
3) AI PowerPointプレゼンテーション作成
4) リアルタイム同時翻訳
5) 問題解決を提供できる AI エージェントとのビデオチャット。
出典: アリババ
Qwen の独自性は、その優れた技術とオープンソースの原則への強い取り組みにあります。Alibaba は、Hugging Face や ModelScope などのプラットフォームでさまざまなバージョンのモデルを提供しています。 同社はこれまで AI に資金を注ぎ込んできたのに、今ではその成果を無料で提供しているのに、なぜ自社のモデルを他社に公開することにしたのかと疑問に思う人もいる。しかし同社は、このアプローチが開発者が一緒に実験し、革新できる協力的な環境を育むと強調し、すべての人がアクセスできるようにすることに固執してきた。収益化は後からでも可能であり、アリババは確実にその方法を見つけるだろうが、現時点では、高度な AI テクノロジーへのアクセスをすべての人に民主化する上で、同社は重要なプレーヤーとして浮上している。
アリババは、主に、電子商取引マーケットプレイスアプリ「タオバオ」などの自社アプリケーション全体で公開されているデータを使ってオープンソースのAIモデルをトレーニングしてきた。月間アクティブユーザーが9億3000万人を超えることを考えると、これは大きな競争上の優位性だ。同社は独自のモデルを公開することで、通常はより透明性が高く、費用対効果が高いオープンソースのAIモデルが、実際にはより悪用されやすいのではないかという議論を巻き起こしている。
特に、月間アクティブユーザー数が 1 億人未満の企業はこれらのモデルを無料で使用できるため、業界全体での幅広い導入が促進されます。オープンソース コミュニティの成長をサポートすることで、アリババは、独自技術への依存を減らしながら、ユーザーが AI 機能を効果的に活用できるようにすることを目指しています。
ChinaAIのジェフ・ディン 広く流布されているAItechtalkの記事を翻訳しました Qwenが現在世界で最も人気のあるオープンソースの大規模モデルである理由 「Hugging Faceのデータによると、Qwenシリーズ/血統のモデルは5万以上に達しています。つまり、世界中の開発者がQwenシリーズをベースに5万以上の派生モデルをトレーニングしており、これは約7万のLlamaシリーズに次ぐものです。このデータは、モデルのエコシステムレベルの影響を判断するための最も説得力のある指標です。」と書かれています。
驚くべきことに、Qwen モデルは昨年、自動車、ゲーム、科学研究など、さまざまな分野から大きな関心を集めました。モデルは導入以来 4,000 万回以上ダウンロードされています。さらに、軽量の Qwen-1.8B モデルは、スマートフォンなどのエッジ デバイスに展開できるように設計されており、計算リソースをあまり必要としないアプリケーションにとって魅力的な選択肢となっています。
Qwen2.5 の最新の包括的なアップグレードは、より大きなパラメータ スケール、より強力な写真とビデオの理解、大規模なオーディオ言語モデル、および継続的なオープン ソース モデルを意味します。大幅に改善されただけでなく、Qwen-Plus と Qwen-Turbo の両方で、複雑なタスクをサポートするための強力な推論機能のコストが削減されました。
今後について、CEOのエディ・ウー氏は、AI開発は急速に進んでいるものの、AGI(汎用人工知能)はまだ初期段階にあると指摘した。同氏はコラボレーションの重要性を強調し、Tongyi QianwenのAPI推論コストが前年比で97%減少したことが、同製品の人気の高まりに貢献している主な要因であると強調した。実際、これは、中国を拠点とする他のほとんどのモデルと比較して、Qwenモデルがより高い精度と事実性を提供していると指摘した、元Huawei幹部のレオ氏によって確認されている。 出力の精度を優先し、モデルの幻覚を最小限に抑えることを目指すエンタープライズユースケースに合わせてカスタマイズできます。 加えて、 Qwen の現時点での最大の強みは、開発者に強力でありながらコスト効率の高い代替手段を提供していることです。
Qwen を最大限に活用するには?
Qwen は、競争力があり、商業的に実現可能な大規模言語モデル (LLM) として際立っています。オープンソース コミュニティで広く採用されているため、より広範な検証とサポートが保証され、その展開は Alibaba Cloud の世界クラスのインフラストラクチャによって支えられています。これらの要素により、Qwen は企業にとって強力な選択肢となっています。以下は、Qwen の企業展開をガイドする 4 つの重要な手順です。
- ビジネス目標とユースケースを定義する: 顧客サポートの自動化、データ分析の強化、コンテンツ生成の改善など、影響の大きいユースケースに重点を置きます。
- データの準備とインフラストラクチャのセットアップ: Qwen モデルのトレーニングと微調整に必要なデータを評価して準備します。これには、関連するデータセットのクリーニング、構造化、および可用性の確保が含まれます。通常、全体のコストの 60~70% がこの層にかかっています。
- パイロットプロジェクトと反復評価: 小規模なパイロット プロジェクトから開始し、結果を事前定義された KPI と比較し、改善のために迅速に反復します。
- スケールアップと統合: Qwen を既存のワークフローに完全に統合してその潜在能力を最大限に活用すると同時に、パフォーマンスを監視および最適化するためのガバナンス構造を確立します。
アリババクラウド
AIとクラウドビジネスは左手と右手のようなものだとジョー・ツァイ氏は言う。ノルウェーのヘッジファンドマネージャー、ニコライ・タンゲン氏との対談ポッドキャスト前述のように、誰でも API を通じて Alibaba の LLM を使用したり、直接オープンソース モデルにアクセスしたりできます。ただし、Qwen を導入したい場合、クラウド コンピューティング パワーが必要であり、Alibaba Cloud がそれを提供します。
実際、現在、中国のテクノロジー企業の80%と、国内の大手モデル企業の半数がAlibaba Cloud上で稼働しています。この規模は、まさに比類のないものです。 ジョー氏は、アジア太平洋地域最大のプロバイダーとしてのクラウド サービスにより、アリババは Tongyi Qianwen のデータとトライアルの収集に大きな優位性を持っていると繰り返し述べました。この好循環により、AI レイヤー全体にわたる 2 つのビジネスが継続的に相互にフィードバックすることができます。
さらに同社は、最大のオープンソースコミュニティ「 モデルスコープ アリババはマーケットプレイス上で他の多くのオープンソース モデルをホストしており、開発者がそれらのオープンソース モデルを使用する場合、コンピューティング能力も必要になります。これがアリババのクラウド収益の主な原動力となっています。
クラウド インフラストラクチャをスタートアップ企業に提供することで、このテクノロジー大手は、消費者向けの最高のアプリケーションに直接アクセスできるようにすることで、リスクを回避したいと考えています。クラウド インフラストラクチャを提供することで、企業はさまざまなドメインやユース ケースにわたる多様なデータ プールにアクセスできるようになります。許可があれば、そのデータを活用して独自のモデルを微調整できる可能性があります。また、このことは、人材の獲得や、この分野のイノベーションへの露出がより容易になることも意味します。
アリババのAIアプリケーション
それでは、アプリケーション面を見てみましょう。アリババは、自社の業務に AI を幅広く統合し、e コマース プラットフォームでの製品推奨、インテリジェントな顧客サービス、AI を活用した広告ターゲティング、クラウド サービスにおける AI 主導のソリューションに活用しています。さらに、物流の効率化やその他のユース ケースを強化するために AI をより有効に活用する方法も模索しています。今日は、まず成熟した事例をいくつか見てみましょう。
人工知能オンラインサービス(AI OS) は、同社の検索エンジニアリングチームが開発したプラットフォームです。AI OS は、パーソナライズされた検索、推奨、広告を統合し、主に Taobao などのマーケットプレイス アプリを中心に、Alibaba のプラットフォーム全体のさまざまなビジネス シナリオをサポートします。もともと Taobao の検索機能に重点を置いたテクノロジーは、ディープラーニング テクノロジーや、検索と推奨のためのさまざまなエンジンを含むように拡張されました。
Dingtalk は Slack に似たエンタープライズ チャット ソフトウェアです。Dingtalk 全体のすべての製品は AI 対応で、2024 年の初めにリリースされたエンタープライズおよび個人向けの組み込み AI エージェントが搭載されています。AI エージェントは、データ分析を検査できる仮想ロボットであり、メモリ、計画、実行機能を備えています。
エージェントと対話する形式は、ChatGPT に似たチャットボットを介して行われます。同社が提案する使用例には、営業担当者、IT、人事管理、財務、調達スタッフとしてのロボットの使用が含まれており、企業は管理プロセス内の多くの反復的な退屈なタスクを自動化できます。
一方、Alimamaは、アリババのeコマースマーケットプレイスアプリであるTmall/Taobaoでのブランドの広告最適化を支援するプラットフォームです。Alimamaはアリババの比較的知られていない事業部門ですが、実際には2007年の非常に早い時期に設立されました。これは、TaobaoまたはTmallプラットフォームで販売している企業向けのデジタルマーケティングプラットフォームです。AIを搭載したマルチメディアLMAは今年4月に開始され、現在2Bアプリケーションに完全に適用されています。ツールには、クライアントからの問い合わせに対応し、基本的な広告デザインタスクを実行して効率と品質を向上させることができるAIセールスエージェントが含まれています。さらに、Alimamaは、予算と価格設定のための販売分析、ROIを高める在庫管理ツール、広告用の費用対効果の高いテキストから画像またはビデオへの生成サービスも提供しています。同社は、このプラットフォームで100万以上の販売者にサービスを提供しており、広告制作コストを大幅に削減したと主張しています。
あらゆる可能性(機会)を捉えるための投資
アリババは、AIチップ開発やLLM開発者に特化した企業を中心に、各レイヤーで有望なAI企業を積極的に買収し、投資してきました。これらの戦略的な動きは、急速に進化するAI分野でアリババの機会を拡大することを目的としています。
また、2024年だけでも、アリババは複数のAI企業への大規模な資金調達ラウンドを主導しており、その中には、Moonshot AIへの1兆4兆1000億ドルの投資(同社の評価額は約1兆4兆2500億ドルに急上昇)、Baichuanへの1兆4兆6億9,100万ドルの資金調達ラウンド(同社の評価額は約1兆4兆280億ドルに上昇)、そして、いわゆる「虎」4社のうち3社であるMiniMaxへの1兆4兆600万ドルを超えるコミットメントなどがある。
現在、中国で最も価値のあるAIスタートアップ4社は「AI(小)四虎」と呼ばれており、いずれも過去3~5年以内に設立され、すでに大きな成功を収めている。 ムーンショットの価値は1兆4,300億ドル, ミニマックスの価値は$2億、 ジプ AIが$8億近くを調達 そして 白川の評価額は1兆4200億に迫るといわれる。
アリババのチップ:Tヘッド
最後に、しばしば見落とされがちなのが、アリババのハードウェア開発への取り組みだ。速報、 チップハードウェアを開発している中国の大手テクノロジー企業はファーウェイだけではない。
アリババの半導体ベンチャー、 Tヘッドは、米国の貿易制限が続く中、中国が半導体の自給自足に向けた幅広い取り組みの一環として、RISC-Vアーキテクチャの開発で大きな進歩を遂げている。T-Headは、人工知能(AI)、ビッグデータ分析、オンライン取引など、さまざまなアプリケーションをサポートできる高性能チップの開発に注力している。
T-Head の注目製品の一つは、エンタープライズ ソリッド ステート ドライブ (SSD) 用に設計されたコントローラ チップである Zhenyue 510 です。Alibaba の Apsara クラウド コンピューティング カンファレンスで発表されたこのチップは、既存のソリューションと比較して入出力操作のレイテンシを 30% 削減することで、Alibaba Cloud のデータ センターのパフォーマンスを向上させると期待されています。このイノベーションは、Alibaba がクラウド サービスを最適化し、大規模なデータ処理タスクの処理効率を向上させることができるため、非常に重要です。
中国が米国の技術に対する制限を乗り越えようとしている中、T-Head が RISC-V に注力していることは、チップの設計と製造における独立性を高める可能性に向けた戦略的な動きを表しています。
私たちが知っていることは、アリババが AI 戦略に総合的なアプローチをとっているということです。包括的なテクノロジー スタックを網羅し、エコシステムの主要プレーヤーとしての地位を確立しており、これらはすべて Qwen モデルをさらに大きく推進するための重要な基盤です。チップ レベルに至るまでのインフラストラクチャ レベルのスケーラビリティを基盤として構築された Qwen モデルは、アリババの広範な e コマース、アプリ、投資エコシステム全体のさまざまなアプリケーションをサポートするように設計されています。この戦略的な焦点は、モデルの機能を強化するだけでなく、精度を優先し、モデルの幻覚を最小限に抑えるさまざまなエンタープライズ主導のユース ケースでのモデルの関連性と有効性を保証します。 同社は、中国の AI エコシステムにおいて最も重要なプレーヤーの 1 つ、いや、最も重要なプレーヤーとしての地位を確立しました。
##
情報源: インタビュー、業界レポート、専門家の見解、企業発表、投資家向け広報資料、Aspara カンファレンスの記録、Alizila。
リンク
- アリババクラウド Qwenへの公式リンク
- Qwen2.5-LLM の説明、最終更新日 2024年9月
- Github Qwen2.5: さまざまなパラメータスケール (0.5B から 72B) をサポートする一連の大規模言語モデルで、長いテキスト生成、命令の追跡、構造化データの理解の機能が向上し、29 の言語をサポートしています。そのアプリケーションは、コード生成、テキスト生成、複雑なデータ処理に適しています。Qwen2.5 は、量子化、推論、ローカル展開などの機能を提供し、Hugging Face、ModelScope、vLLM などのさまざまな計算フレームワークと互換性があります。
- ギットハブ クウェン-VL: 画像とテキストの両方の入力をサポートし、多言語会話機能を備えた大規模な視覚言語モデルです。特に中国語と英語の画像テキスト認識に優れています。このモデルは高解像度の画像処理ときめ細かい認識をサポートしており、ほとんどのオープンソース モデルよりも優れています。
- ギットハブ Qwen-オーディオ: さまざまなオーディオ入力 (人間の音声、自然音、音楽など) を処理し、テキスト出力を生成することができます。このモデルは、オーディオ認識、オーディオ説明、シーン分類、感情認識などのタスクに適しています。
- ギットハブ Qwen2.5-数学: 中国語と英語の両方で数学の問題の解決をサポートし、Chain of Thought (CoT) と Tool-Integrated Reasoning (TIR) を統合しています。
- ギットハブ Qwen2.5 コーダー: 128K のコンテキスト ウィンドウをサポートし、92 のプログラミング言語をカバーする最新のオープン ソース プログラミング モデル。
著者略歴
グレースはAI x エネルギー、AI x 地政学、AI x ビッグテックについて書いています。 AI ProemでのSubstack。
彼女はまた、 運, 外交官、および AI、テクノロジー、コーポレートガバナンスに関するその他の国際出版物で記事を執筆しています。ジャーナリストとしての経歴を持つグレースは、シンガポールを拠点に CNBC でアジアのテクノロジーとビジネスについてレポートしたほか、SCMP、S&P Global Market Intelligence、Yahoo Finance、USA Today にも記事が掲載されています。
グレースのトップ 5 の読み物:
- AI軍拡競争はまだまだ終わらない。チップはゲームの半分に過ぎず、インフラが残りの半分を占める。
- データセンターがまだ完全に再生可能エネルギーに移行できない理由
- 大手テクノロジー企業の決算発表: AI に全力投球
- 百度、アリババ、テンセント:AI対決
- 核の世界
次回の大きな深掘りは、Huawei対NvidiaとGoogle
最新のブログ投稿の更新情報を受け取るには購読してください
コメントを残す: