回顾一下 Google Gemini 和 Vertex AI 集团产品经理 Lewis Liu 在《AI Business Asia Podcast》第 2 集中讨论的要点。

如果你想观看该集 → Spotify | 苹果 

在快节奏的人工智能 (AI) 领域,尤其是在大型语言模型 (LLM) 领域,进步速度空前。本综述探讨了 Google 在 LLM 方面的最新进展,包括向增量发布的转变、创新功能的集成以及与全球模型的竞争格局。我们还深入探讨了数据的作用、第一方数据的优势以及企业级 AI 体验需要什么。

谷歌在法学硕士方面的进步

在过去一年中,Google 团队显著加快了 LLM 发布速度,发布了约 200 个更新,而前几年只有 20-30 个,增长了 10 倍。这一转变反映了从传统的大规模发布方式向更敏捷、渐进式发布方式的转变。 

创新功能

  • 受控发电:Google 推出了受控生成功能和受控解码功能。此功能允许开发人员为模型提供架构,确保生成的 JSON 对象准确无误并符合指定的架构。此功能首次随 Gemini 1.5 Pro 模型一起提供,最近被 OpenAI 采用。
  • 上下文缓存: 另一项创新是上下文缓存,它有助于管理广泛的上下文窗口,其中 Google 率先推出了最多 200 万个标记的上下文窗口。这些进步凸显了 Google 致力于增强模型功能和用户体验的承诺。

竞争定位

在人们认为谷歌缺乏竞争优势的情况下,该公司一直专注于快速创新并响应全球人工智能的进步。讨论还涉及来自中国的新兴模型所带来的挑战和机遇,其中长上下文处理和中文微调方面的进步是显而易见的。

人工智能模型的全球格局

来自中国的模特

在中国开发的模型因其能力而备受关注,尤其是在处理长文本和根据中文定制响应方面。对话显示,尽管谷歌关注这些发展,但由于监管限制,该公司并未直接与中国市场打交道。

人工智能中的身份和国籍

一个重要的讨论话题是法学硕士是否应该具有国家身份或受到地理边界的影响。共识是,虽然模型反映了其创建者的偏见和身份,但对国家模型的大量投资可能没有必要。相反,针对特定用例进行微调可能更为实际。

数据在法学硕士发展中的作用

高质量数据的重要性

高质量的数据仍然是训练有效 LLM 的基石。在生成式 AI 领域,数据的质量和多样性直接影响模型生成准确、相关且情境感知输出的能力。经过深思熟虑后,合成数据可以扩展 LLM 可以实现的边界,尤其是在现实世界数据可能有限或有偏差的情况下。LLM 的发展越来越多地受到各种数据源的驱动,包括人机交互,这增强了模型推理、规划和生成更细微响应的能力。

第一方数据和基础设施

  • 初创企业面临的挑战:初创公司在与拥有大量第一方数据的大型企业竞争时面临巨大挑战。谷歌等公司对专有数据和强大基础设施的重视凸显了这些要素在创建差异化 LLM 应用程序中发挥的关键作用。对于初创公司来说,缺乏对第一方数据的访问可能是一个相当大的障碍,因此探索数据获取和模型训练的创新方法至关重要。
  • 法规遵从性: 为 AI 提供事实、可靠的信息对于开发企业级解决方案至关重要。在生成式 AI 的背景下,基础信息可确保模型产生的输出不仅准确,而且符合现实世界的背景和法规。这在企业应用中尤为重要,因为企业应用的风险很高,不准确的成本可能很高。遵守法规合规性是另一个重要方面,因为它可确保 AI 解决方案在其服务行业的法律框架内运行,从而降低法律纠纷风险并培养用户之间的信任。

构建企业级 AI 体验

企业采用人工智能需要仔细考虑几个关键因素,以确保成功实施和创造价值: 

  1. 平台功能: 企业需要的不仅仅是一个模型或 API。一个全面的平台应该支持模型微调、评估和提炼。协作功能至关重要,让团队能够根据提示进行协作并有效地跟踪变化。
  2. 安全和隐私: 强大的安全措施至关重要。例如,谷歌实施了强大的加密技术,以确保员工无法访问客户数据。这种级别的数据保护对于维持信任和遵守法规至关重要1。
  3. 可扩展性: 大规模部署模型的能力对于企业应用至关重要。这包括对成本效益和性能优化的考虑。
  4. 事实和依据: 企业需要能够提供准确、真实信息的 AI 系统。检索增强生成 (RAG) 等技术可以帮助 AI 响应基于经过验证的数据源,从而减少幻觉并提高可靠性。
  5. 与现有系统集成: 为了实现最高效率,AI 应该与组织现有的工具和工作流程无缝集成。Google 将 Gemini 整合到 Gmail 和日历等广泛使用的应用程序中的做法就体现了这一策略。
  6. 定制和微调: 让模型适应特定行业需求或公司数据的能力至关重要。这使得企业能够利用人工智能来满足其独特用例和专有信息。
  7. 合规与监管遵守: 企业 AI 解决方案的设计必须考虑监管要求,确保其符合行业特定的标准和数据保护法。
  8. 成本管理: 虽然某些 LLM 功能正在商品化,但企业在选择和实施 AI 解决方案时必须平衡质量、延迟和成本。
  9. 持续评估: 鉴于人工智能发展的快速步伐,企业应该使用自己的数据和用例实施对人工智能模型进行持续评估的框架,而不是仅仅依赖公共基准。
  10. 道德考虑: 负责任的人工智能开发和部署应成为优先事项,解决潜在的偏见并确保公平、合乎道德地使用人工智能技术

以下是一些 Google Cloud GenAI 案例研究:

联邦银行

  • 增强聊天机器人交互:使用 Vertex AI 使聊天机器人 Feddy 更加像人类并且个性化。
  • 全天候多语言支持:实施人工智能,提供全天候、多语言客户服务。
  • API 集成: 开发了 API 门户以简化金融科技协作并提高安全性。
  • 员工效率: 使用 Firebase 创建了一款移动应用程序来提高员工的工作效率。
  • 数据安全: 使用 Cloud Armor 防御 DDoS 攻击并确保数据合规性。

神秘蝇

  • 客户入职: 创建了使用 Vertex AI 的 AI 聊天机器人 Mystic,以简化用户入职流程并减少对代理支持的需求。
  • 增强自助服务:Mystic 处理复杂的查询,提高用户满意度。
  • 可扩展性:人工智能聊天机器人可以同时管理多个查询,并将未解决的问题上报给人工代理。

考弗

  • BharatGPT 开发: 使用 Vertex AI 构建多语言 AI 平台,使品牌能够使用母语与客户交谈。
  • 定制和安全:利用 Google 的安全基础设施提供灵活的数据使用。
  • 可扩展性: 使用 Kubernetes Engine 的自动扩展功能来有效管理峰值流量。
  • 创新合作: 与 Google Cloud 合作,持续创新并提供以客户为中心的解决方案。

给初创企业和高管的建议

对于初创企业

灵活: 人工智能技术的快速发展要求初创公司保持敏捷和响应能力。鉴于技术进步的不可预测性,制定长期路线图可能具有挑战性。初创公司应专注于快速适应新发展并尝试新兴技术。

对于高管

评估用例: 鼓励高管在实施 AI 战略时不要只看炒作和基准。根据实际用例评估模型并用数据进行评估至关重要。公共基准可能并不总是反映模型在现实场景中的表现,因此实际测试至关重要。

结论

大型语言模型的格局正在迅速演变,谷歌等老牌企业和全球新兴模型都取得了重大进展。受控生成和上下文缓存等创新正在为 LLM 功能设定新标准。随着人工智能技术的不断发展,了解数据的作用、地理影响的影响以及敏捷开发的重要性将成为在这个充满活力的领域保持领先地位的关键。 

对于初创企业和企业高管来说,保持灵活并专注于实际应用对于驾驭人工智能的未来和确保成功实施至关重要。

请确保您已订阅,以便收到我们未来播客的通知。剧集 → YouTube | Spotify | 苹果  | RSS 

发布者 蒋兆和
上一篇文章
你可能还会喜欢

留下你的评论:

您的邮箱地址不会被公开。 必填项已用 * 标注