做好“关键基础设施提供商”角色，亚马逊云科技加快生成式AI落地

一场关于生产力的革命已在酝酿之中。全球管理咨询公司麦肯锡在最近的报告《生成式人工智能的经济潜力：下一波生产力浪潮》中指出，生成式AI每年可能为全球经济增加2.6万亿到4.4万亿美元的价值。在几天前的亚马逊云科技纽约峰会中，「生成式AI」同样是全场提及频率最高的关键词。

「如今，大模型可以在大量无标注数据中进行预训练，实现开箱即用，以处理各种通用性问题。此外，只需相对少量的标注数据进行微调，它们就能用于特定领域的应用。」亚马逊云科技数据库、数据分析和机器学习全球副总裁Swami Sivasubramanian表示，「通过微调轻松定制预训练模型的能力，绝对是游戏规则的改变。」

凭借过去数年的客户需求洞察和技术积累，亚马逊云科技将大量的AI能力集成到了简单易用的产品之中，希望以最简洁的方式将技术进步输送到各行各业。在这场技术盛会上，亚马逊云科技一口气推出了七项生成式AI新功能。

最强的生成式AI大模型，在这里轻松调用

今年4月，亚马逊云科技发布了全托管基础模型服务「Amazon Bedrock」，以「关键基础设施提供商」的角色加入了大模型之战。

从希望应用大模型的企业角度来说，自研大模型需要数十亿美元和多年的训练，更优的解决方案是对一些已经非常强大的开源基础模型进行定制化的微调，以满足自身的多样化业务需求。Amazon Bedrock的重要价值就在于此。这项服务可以让所有人都可以基于已有的大模型、专用的AI算力和工具，再结合自己的数据开始构建生成式AI应用。

在最新扩展后的Amazon Bedrock中，汇聚了来自一批顶级大模型供应商的最新成果：

目前，Amazon Bedrock提供了Anthropic最新语言模型Claude 2、AI21的JURASSIC-2、亚马逊自研的Amazon Titan系列模型的访问。Stability AI也在Amazon Bedrock中首发了最新版的文生图模型套件Stable Diffusion XL 1.0。此外，Cohere成为了最新加入Amazon Bedrock的基础模型供应商，并带来了文本生成模型Command和文本理解模型EMBED。

相比于其他的一站式的大模型服务平台，Amazon Bedrock的优势在于，用户可将其与亚马逊云科技平台的其余部分集成在一起，更轻松地访问存储在Amazon S3对象存储服务中的数据，并能够从亚马逊云科技访问控制和治理策略中受益。

生成式AI让云计算服务的竞争格局发生了改变，除了原有的存储、计算、网络等基础设施，模型、框架和应用层面的能力提供变得更为重要。在过去一段时间，我们见到了「模型即服务」这种全新商业的诞生。如同Amazon Bedrock这样的一系列平台，正在将大模型变为直接可用的服务，帮助各行各业的用户接入生成式AI，撬动了一个全新的蓝海市场。

推动生成式AI走完落地的「最后一公里」

在今天，即使生成式AI模型的功能已经如此强大，它们仍然无法代替人类「执行」一部分关键的、个性化的任务。这恰恰是「生成式AI」转化为「生产力」过程中非常关键的一步。

问题并非不能解决：模型通常可以附加API、插件、数据库以扩展功能，为用户自动完成某些特定的任务。比如ChatGPT此前就推出了插件机制，还为开发者提供了开放平台，允许更多用户根据自己的需求、想法和专业能力进行扩展。为了简化这一环节所需的工作，亚马逊云科技正式推出了Amazon Bedrock Agents。

Amazon Bedrock Agents可以扩展基础模型以理解用户请求，将复杂任务分解为多个步骤，开展对话以收集更多信息，并采取行动来满足用户请求。开发者只需点击几下，就能创建完全托管的Agents：

该功能创建的对话式智能体可根据专有数据提供个性化的最新答案并执行操作，帮助企业加速交付生成式AI应用程序，推动解决生成式AI落地的「最后一公里」问题。比如，企业可以使用Amazon Bedrock Agents创建一个可以处理订单的客户服务聊天机器人，利用其内部信息（包括客户资料和退货政策）来定制化服务于每个订单。

如果做个比喻的话，Amazon Bedrock Agents就像是一个得力的助手。或许在不久的将来，我们就能享受这一功能所提供的用户端服务：不只是显示有哪些合适的航班、推荐口碑好的餐厅，还能直接帮忙预订、跟进。

生成式AI时代的搜索技术变革

在解决大模型落地挑战的火热讨论中，「向量搜索」和「向量数据库」的概念开始被越来越多的人熟知。这是检索技术层面在生成式AI时代正在发生的变革。

首先，伴随数据规模的增长，关键词检索已经不能满足需求，向量检索可作对传统搜索技术的补充。通过将数据表示为向量，模型可以快速分析和理解大量信息，准确地识别和匹配相似的项目。

其次，经过预训练的大模型固然能力出众，但也存在一些不足，比如缺乏领域知识、缺乏长期记忆、缺乏事实一致性的问题。而在数据规模不断增长、算力日益珍贵的现状下，向量数据库可作为大模型的「超级大脑」，打一份小抄，相对较低的成本补充动态知识，满足用户不断增长的需求。

对于这一方向，亚马逊云科技早早发力，此前已上线多项支持向量的数据存储服务，包括Amazon Aurora PostgreSQL兼容版关系型数据库，兼容PostgreSQL的Amazon RDS（Amazon Relational Database Service）关系型数据库等。

在这一次的峰会上，亚马逊云科技又推出了适用于Amazon OpenSearch Serverless的向量引擎。该向量引擎支持简单的API调用，可用于存储和查询数十亿个Embeddings。

该引擎由Amazon OpenSearch项目中的k最近邻(kNN)搜索功能提供支持，为客户提供无服务器环境下的语义搜索服务。即使向量从原型设计期间的几千个增长到数亿甚至更多，引擎也能无缝扩展，无需重新索引或重新加载数据来扩展基础设施。

顺应大模型时代的广泛需求，亚马逊云科技还正式宣布，平台上所有的数据库未来都将具有向量功能，帮助客户简化运营，方便集成数据。

让生成式AI落地多重加速

在这些重磅发布之外，为了加速生成式AI的训练和应用，亚马逊云科技已推出了一系列服务和工具。

最新动态是，两项关键服务已正式可用：其中一项服务是关于计算基础设施，基于英伟达H100 Tensor Core GPU的Amazon EC2 P5实例已正式可用，满足客户在运行工作负载时对高性能和高扩展性的需求。

很多业界知名的生成式AI模型同时涵盖问题回复、代码生成、视频和图像生成、语音识别等功能，规模通常有千亿或万亿参数，训练时间甚至长达数月。这势必会成为普遍影响生成式AI落地速度的因素之一。

与上一代基于GPU的实例相比，Amazon EC2 P5实例使得训练最高提速6倍，曾经的几天训练时间可缩短到几小时，帮助客户降低高达40%的训练成本。

另外一项服务是有关于开发工具。去年，亚马逊云科技推出了AI编程助手Amazon CodeWhisperer预览版，获得了开发者的高度关注。数据表明，与未使用该编程助手的开发者相比，使用者完成任务的速度平均快57%。现在，Amazon CodeWhisperer已经正式可用，并且实现了与Amazon Glue的集成。

从此以后，开发者可以用自然语言编写特定任务，Amazon CodeWhispere会直接在Amazon Glue Notebooks中推荐一个或多个可完成此任务的代码片段，用户可以选择「接受最推荐的建议」、「查看更多建议」或「继续自己编写代码」。也就是说，即使完全不会写代码，你也可以尝试用「说人话」的方法构建出完整的应用程序。

写在最后

技术的发展往往超乎人们的预设。曾几何时，研究者们还需要花费数月的时间进行数据准备、数据处理和模型训练，不得不投入极其高昂的成本，只为了完成某一项特定的任务。

在这场浪潮中，亚马逊云科技选择的路线是做好「关键基础设施提供商」的工作。它的优势在于过去20年在人工智能技术上的深厚积累，在于对于超过10万家客户的深刻理解，在于打磨多年的高可用、强大的基础设施。这些都会有力地推动亚马逊云科技加快生成式AI落地的征程，帮助到每一位开发者或创业团队。