Meta 发布了迄今为止最大、最好的开源 AI 模型

元宇宙头条 2024-07-25 13:00:00 热度 17286

元宇宙头条

11-14 14:28 494288

The Verge7月24日报道，今年四月，Meta 曾透露其正在为 AI 行业打造一个史无前例的开源模型，其性能可以媲美 OpenAI 等公司的最佳私有模型。

今天，这个模型终于面世了。Meta 发布了 Llama 3.1，这是迄今为止最大的开源 AI 模型。Meta 声称，该模型在多个基准测试中表现优于 GPT-4o 和 Anthropic 的 Claude 3.5 Sonnet。Meta 还在更多国家和语言中推出了基于 Llama 的 Meta AI 助手，并增加了一项可以根据个人特征生成图像的功能。CEO 马克·扎克伯格预测，到今年年底，Meta AI 将成为使用最广泛的助手，超过 ChatGPT。

Llama 3.1 比几个月前推出的小型 Llama 3 模型复杂得多。最大的版本拥有 4050 亿个参数，使用超过 16,000 个 Nvidia 超昂贵的 H100 GPU 进行训练。Meta 并未披露开发 Llama 3.1 的成本，但仅从 Nvidia 芯片的费用来看，可以推测这笔费用高达数亿美元。

那么，鉴于成本高昂，Meta 为什么仍然通过仅要求获得数亿用户公司的批准的许可来免费发布 Llama 呢？在 Meta 公司博客发布的一封信中，扎克伯格认为，开源 AI 模型将超越并且已经比私有模型进步更快，这类似于 Linux 成为今天大多数手机、服务器和设备的开源操作系统。

他将 Meta 在开源 AI 上的投资比作早期的 Open Compute Project，他表示该项目通过让惠普等外部公司帮助改进和标准化 Meta 的数据中心设计，为公司节省了“数十亿美元”在建立自己能力的过程中。展望未来，他预期 AI 领域也将出现同样的动态，他写道：“我相信 Llama 3.1 的发布将成为行业的一个转折点，大多数开发人员将开始主要使用开源。”

为了推广 Llama 3.1，Meta 正与包括微软、亚马逊、谷歌、Nvidia 和 Databricks 在内的二十多家公司合作，帮助开发者部署他们自己的版本。Meta 声称，Llama 3.1 的运行成本约为 OpenAI 的 GPT-4o 的一半。Meta 将发布模型权重，使公司能够根据自定义数据进行训练和调整。

不出所料，Meta 对于用于训练 Llama 3.1 的数据没有透露太多。AI 公司员工表示，他们不公开这些信息是因为它是商业机密，而批评者则认为这是为了拖延即将到来的版权诉讼潮。

Meta 表示，它使用了合成数据，即由模型生成的数据，而不是人类生成的数据，以使具有 4050 亿参数版本的 Llama 3.1 改进较小的 700 亿和 80 亿版本。Meta 的生成式 AI 副总裁 Ahmad Al-Dahle 预测，Llama 3.1 将受到开发者的欢迎，作为“小模型的老师，然后以更具成本效益的方式部署”。

当我询问 Meta 是否同意业内越来越多的观点，即行业正在耗尽高质量的模型训练数据时，Al-Dahle 认为这个上限确实存在，但可能比一些人预期的要远。他说：“我们肯定认为我们还有几次[训练]机会，但很难说。”

首次，Meta 对 Llama 3.1 的红队测试（或对抗测试）包括了潜在的网络安全和生化使用案例。另一个更严格测试模型的原因是 Meta 所描述的“代理”行为的出现。

例如，Al-Dahle 告诉我，Llama 3.1 能够集成搜索引擎 API，“根据复杂的查询从互联网上检索信息，并依次调用多个工具以完成任务。”他举的另一个例子是让模型绘制过去五年中美国售出的房屋数量图表。“它可以为你检索[网页]搜索，并生成 Python 代码并执行它。”

Meta 自己实现的 Llama 是其 AI 助手，被定位为类似 ChatGPT 的通用聊天机器人，可以在 Instagram、Facebook 和 WhatsApp 的各个部分找到。从本周开始，Llama 3.1 将首先通过 WhatsApp 和 Meta AI 网站在美国上线，随后将在未来几周内在 Instagram 和 Facebook 上推出。它还将更新支持新语言，包括法语、德语、印地语、意大利语和西班牙语。

虽然 Llama 3.1 最先进的 4050 亿参数模型可以在 Meta AI 中免费使用，但在每周超过未指定数量的提示后，助手会将你切换到更简化的 700 亿参数模型。这表明 4050 亿参数模型对于 Meta 来说在全面规模上运行成本过高。发言人 Jon Carvill 告诉我，公司将在评估早期使用情况后提供更多关于提示阈值的信息。

Meta AI 推出了一项新的“Imagine Me”功能，通过手机摄像头扫描你的面部，然后将你的样貌插入生成的图像中。通过这种方式捕捉你的样貌，而不是通过你个人资料中的照片，Meta 希望避免创建一个深度伪造机器。公司认为，人们希望创建更多种类的 AI 媒体并将其分享到他们的动态中，即使这意味着模糊了真实与虚拟之间的界限。

在未来几周内，Meta AI 也将进入 Quest 头戴式显示器，取代其语音命令界面。就像在 Meta Ray-Ban 眼镜中的应用一样，你将能够在 Quest 的透视模式下使用 Meta AI 识别并了解你在显示器中看到的现实世界内容。

尽管扎克伯格预测 Meta AI 将在今年年底成为使用最广泛的聊天机器人（ChatGPT 拥有超过 1 亿用户），但 Meta 尚未公布其助手的任何使用数据。“我认为整个行业在产品市场契合度方面仍处于早期阶段，”Al-Dahle 说。即使 AI 已经感觉到过度炒作，但很明显，Meta 和其他参与者认为比赛才刚刚开始。

新闻来源：The Verge 作者：Alex Heath

编辑：Audrey

（声明：请读者严格遵守所在地法律法规，本文不代表任何投资建议）

元宇宙电商虚拟购物

本文来源：元宇宙头条文章作者：元宇宙头条