Leo 的观点
作为华为云的前首席数据官,我建立了该地区最大的初创企业生态系统之一,因此我可以直接接触到:
- 开发 GPU 芯片组、LLM(大型语言模型)和其他 LM(大型模型)的组织和团队;
- 正在踏上人工智能转型之旅的企业;以及
- 来自东西方的人工智能初创企业正在打造法学硕士学位、GenAI 工具和应用程序。
这和你有什么关系?
- 如果你 企业高管或专业人士本文将为您提供当前 LLM 和 GenAI 技术格局的全面了解以及对潜在风险和机遇的实用见解。
- 如果你 创始人或投资者本文将帮助您了解在探索 AI 的过程中所面临的陷阱和真正的机遇。
Leo 的观点如下,这些观点是我根据自己的经验和市场尽职调查得出的,包括研讨会、访谈和与相关领域从业者的讨论。这些从业者包括研究分析师、开发人员、企业高管和创始人,以确保观点全面可信。
GenAI 和 LLM 的现状
GenAI 和 LLM 技术栈已经稳定下来,以下每一层都有自己的业务模式、挑战和机遇。了解这些层对于驾驭 AI 格局和做出明智的业务决策至关重要。
第 0 层(云和基础设施)——“钱在哪里”
这一层是支撑整个 GenAI 堆栈的裸机。它占 GenAI 总价值的 80%+,令人震惊 经济。 尽管 Nvidia 占据主导地位,占据了芯片制造商市场近 95% 的份额(Nvidia 以 3T 市值击败苹果),市场正在吸引其他大佬,例如 华为黄仁勋将华为列为 NVIDIA 的“强大”竞争对手尤其是在人工智能芯片市场。同时,它也吸引了初创企业、创新者等 格罗格他们正向市场推出专用芯片 LPU(语言处理单元),专注于人工智能推理的性能和精度。
Leo的看法: Nvidia 最大的护城河不仅仅是强大的芯片组,还有它多年来建立的 Cuda 生态系统。它为开发人员提供以下支持:
- 不同的语言和 API;
- 针对不同领域任务的库和框架;
- 开发工具;以及
- 生态系统合作伙伴
虽然华为和 AMD 等其他公司也提供类似的产品,但它们生态系统的可用性和丰富程度却各不相同。这导致开发人员需要付出更多努力来构建与底层芯片兼容的模型,这使得从 Nvidia 迁移到其他芯片制造商的成本成为一个重大障碍。对于像 AMD 这样的上市公司来说,专注于生态系统开发的决定具有挑战性,因为它需要长期投资,并且不会产生短期或中期回报。华为作为一家非上市公司,在这方面确实有优势,但美国的制裁也阻碍了它的进步。
第 1 层(基础模型和 LLM)——“谁能制造最大的炸弹?”
GenAI 堆栈的引擎为所有 GenAI 应用程序提供动力,这些应用程序由那些能够构建最强大模型的人驱动,而且它在国际和国内都有发生,尤其是在美国和中国。
- Anthropic 与 OpenAI 之间的竞赛 Claude 3.5 Sonnet 模型优于竞争对手的模型; 和
- 闭源LLM与开源LLM之间的竞争,差距有6~10个月的滞后。
来源: 领英
- “中国LLM百强战”——中国数百家LLM厂商之间的价格战 加剧字节跳动在今年5月底推出了一款售价为10%的机型,随后阿里云和百度也推出了类似价位的机型。
我们开始看到西方和东方之间的“人工智能冷战”。
- OpenAI 计划从 7 月 9 日起在中国屏蔽 API 访问,这促使中国法学硕士项目开发商向数万名开发者提供替代方案。中国早在 2023 年就实施了《生成人工智能服务管理暂行办法》,提高了外国法学硕士项目在中国发展的门槛。
- 中国主导的人工智能决议在联合国大会获得通过为了应对中美之间日益紧张的关系,中国正利用软实力倡导在“自由、开放、包容和非歧视”的环境中发展人工智能。
Leo的看法: LLM 竞赛的本质不仅仅是技术,还关乎根植于国家或地区文化和语言的“智慧存在”。例如,新加坡向其国家多模态大型语言模型 (LLM) 项目 Sea-lion 投资 $7000 万新元,证明了 这。
从技术上讲,LLM 领域最终将趋于少数几种模式,包括闭源和开源。OpenAI 等领导者可能会领先其他公司 6 到 12 个月。开源模式正在迅速缩小差距,因为大多数企业更喜欢选择开源模式,希望保留控制权和隐私。去年我在新加坡参加的经济学人情报网络 AI 论坛的民意调查结果显示,超过 70% 的 C 级职位对开源 LLM 开放。
资料来源:AI Business Asia,经济学人智能新加坡人工智能论坛,2023 年
企业不再评估 LLM 的“马力”;自 2024 年初以来,他们一直在通过快速 PoC 加速其 GenAI 转型,尽管免费 PoC 或预算在 $50K 至 $100K 之间仍然是主流。这为上述层和新层的融合创造了一场“完美风暴”。
新兴层和领域模型层——“B2B 初创企业的战场”
模型即服务 (MaaS) 是基础设施和基础模型层的混合层。它让公司能够轻松利用具有预训练模型的 LLM 功能,并降低人力资本成本。LLM 操作层是帮助公司简化应用开发流程和构建领域特定模型的工具层。领域特定模型是针对特定行业或任务进行有针对性的训练(微调)。
Leo的看法: 这是 B2B 初创企业的战场,他们共同试图解决一个问题——如何以最佳效率构建 GenAI 应用程序?
开发和运营 GenAI 应用程序的旅程非常复杂,到 2024 年,它已经吸引了数千家 B2B 初创公司进入这个领域,他们都相信“淘金热期间卖铲子”的想法。其中许多都做得很好,例如 Langchain、Flowiseai。然而,新兴层是动荡的空间,主要是因为基础模型 (LLM) 层的发展速度。LLM 的边界和功能正在不断发展,这使得早期版本的 LLM 过时了,例如 GPT3.5 正在贬值,并且正在添加可能与其中一些工具重叠的新特性和功能。
云服务提供商正在进入 MaaS 领域,他们以 API 的形式提供预先训练好的开源模型;最终,这是一场每秒代币数量和相关成本的竞争。话虽如此,像 Huggingface 这样建立了自己的模型并组建了一个伟大的开发者社区的参与者仍然蓬勃发展;例如,据估计,Huggingface 去年产生了 $70M ARR。我支持这一点,但我确实认为这笔收入主要归功于其合作伙伴 AWS,而不是基于 AI 推理收入份额的开发者。
那么,这有什么可说的呢?在这五个层次中,这是我最喜欢的领域,我非常尊重这个领域的建设者和创始人。他们创造了“多重”,帮助整个生态系统产生更好的结果和价值。与此同时,对于初创企业和投资者来说,风险相当高,但回报也很高。
因此,无论您是创始人还是投资者,我认为三个关键成功因素(按照此顺序)是:
- 观众至上;
- 问题排在第二位;
- 最后,您的产品。
需要注意的是,你的受众不一定是你的客户。在很多情况下,你可能需要先发展你的受众群体,然后再从其他来源获取收入,就像 Huggingface 的情况一样。
第 3 层(GenAI 应用)——“对速度的需求”
这是所有层中竞争最激烈的一层,主要由 B2C GenAI 应用和工具驱动。a16z 发布了排名前 50 的 GenAI 网络产品;根据每月访问量,与我们 2023 年 9 月的初始报告相比,该报告显示,名单上超过 40% 的公司是新公司。这种人员流动与公司完成产品市场契合 (PMF) 的能力和速度有关。这促使大多数这些 B2C 公司选择收购一些知名的 LLM,例如 GPT4 和 Llama3,投资者经常批评它们是一家包装公司。
来源:a16z
Leo的看法: 成为包装公司并不丢人,因为让客户满意的最终产品才是最重要的。随着底层 LLM 成为一种商品,您协调 AI 的方式(例如延迟、工作流集成和 UI)将变得至关重要。在这方面,人力代理是产品中最重要的。
自 2023 年以来,我采访了西方(如美国和欧盟)和东方(如中国和新加坡)之间 100 多家 AI 初创公司,从种子期到独角兽。双方的上市方式截然不同;美国初创公司非常以产品为中心,而中国初创公司在服务方面则灵活得多。主要原因是亚洲市场需要更多定制。这是影响应用程序公司成功的人为因素之一。为此,我并不是指创建一个可定制到可以扩展的应用程序,而是指能够快速推出具有特定功能并迎合小众领域或受众的应用程序。中国不再是你所知道的世界工厂,生产你日常使用的消费品。现在,它正准备成为 AI 应用程序的世界工厂,尤其是考虑到 GenAI 应用程序的激增。
查看我的帖子,“如果你采取正确的方法,在不到一年的时间内就能打造出一家价值百万美元的初创企业.”
他们成功的秘诀是什么?
对亚洲初创企业和企业的影响
LLM 和 GenAI 评估是迄今为止人类历史上发展速度最快的技术进步,而且它不是在放缓,而是在加速。C 级和创始人面临的最大挑战不是选择模型和应用程序,而是解决不断扩大的知识差距,并制定战略和执行措施,确保 AI 为他们服务。
亚洲是一个独特的充满挑战和前景的市场,人口最多且非同质化。然而,它往往较少受到美国人工智能制造商的关注。例如,OpenAI 今年才在东京开设了第一家办事处,我接触过的大多数美国人工智能初创公司都只专注于美国和欧盟。例如,Huggingface 在亚洲只有几名员工。这种情况对亚洲的创始人和企业来说既是问题也是机遇,了解这些动态至关重要。
订阅以获取最新博客文章更新
留下你的评论: