GPT-4o Mini 亮相:Claude Haiku、Gemini Flash和GPT3.5Turbo的经济高效、高性能替代品

据七元宇宙7月24日消息,OpenAI 是扩展生成式预训练 Transformer (GPT) 模型的领导者,现已推出 GPT-4o Mini,转向更紧凑的 AI 解决方案。此举解决了大规模 AI 的挑战,包括高成本和能源密集型训练,并使 OpenAI 能够与 Google 和 Claude 等竞争对手竞争。GPT-4o Mini 为多模态 AI 提供了一种更高效、更实惠的方法。本文将通过将 GPT-4o Mini 与 Claude Haiku、Gemini Flash 和 OpenAI 的 GPT-3.5 Turbo 进行比较,探索 GPT-4o Mini 的独特之处。我们将根据六个关键因素评估这些模型:模态支持、性能、上下文窗口、处理速度、定价和可访问性,这些因素对于为各种应用选择合适的 AI 模型至关重要。


揭开 GPT-4o Mini 的面纱:

GPT-4o Mini是一种紧凑的多模态 AI 模型,具有文本和视觉智能功能。尽管 OpenAI 尚未分享有关其开发方法的具体细节,但 GPT-4o Mini 建立在 GPT 系列的基础上。它专为经济高效且低延迟的应用程序而设计。GPT-4o Mini 适用于需要链接或并行化多个模型调用、处理大量上下文以及提供快速实时文本响应的任务。这些功能对于构建检索增强生成 (RAG)系统和聊天机器人等应用程序尤其重要。

GPT-4o Mini 的主要功能包括:

  • 128K 个 token 的上下文窗口

  • 每个请求最多支持 16K 个输出令牌

  • 增强对非英语文本的处理

  • 截至 2023 年 10 月的知识

GPT-4o Mini、Claude Haiku 和 Gemini Flash:小型多模态 AI 模型的比较

本节将 GPT-4o Mini 与两个现有的小型多模态 AI 模型 Claude Haiku 和 Gemini Flash 进行比较。Anthropic 于 2024 年 3 月推出的 Claude Haiku 和谷歌于 2023 年 12 月推出的 Gemini Flash(2024 年 5 月发布了更新版本 1.5)是其重要的竞争对手。
  • 态支持:GPT-4o Mini 和Claude Haiku目前都支持文本和图像功能。OpenAI 计划在未来添加音频和视频支持。相比之下,Gemini Flash 已经支持文本、图像、视频和音频。

  • 性能:OpenAI 研究人员已在多个关键指标上对 GPT-4o Mini 与Gemini Flash和 Claude Haiku 进行了对比。GPT-4o Mini 的表现始终优于其竞争对手。在涉及文本和视觉的推理任务中,GPT-4o Mini 在 MMLU 上的得分为 82.0%,超过 Gemini Flash 的 77.9% 和 Claude Haiku 的 73.8%。GPT-4o Mini 在 MGSM 上的数学和编码得分为 87.0%,而 Gemini Flash 为 75.5%,Claude Haiku 为 71.7%。在衡量编码性能的 HumanEval 上,GPT-4o Mini 得分为 87.2%,领先于 Gemini Flash 的 71.5% 和 Claude Haiku 的 75.9%。此外,GPT-4o Mini 在多模态推理方面表现出色,在 MMMU 上的得分为 59.4%,而 Gemini Flash 为 56.1%,Claude Haiku 为 50.2%。

  • 上下文窗口:更大的上下文窗口使模型能够针对扩展的段落提供连贯且详细的答案。GPT-4o Mini 提供 128K 令牌容量,每个请求最多支持 16K 输出令牌。Claude Haiku 的上下文窗口更长,为 200K 令牌,但每个请求返回的令牌较少,最多为 4096 个令牌。Gemini Flash 拥有明显更大的上下文窗口,为 100 万个令牌。因此,Gemini Flash 在上下文窗口方面比 GPT-4o Mini 更具优势。

  • 处理速度:GPT-4o Mini 比其他型号更快。它每分钟处理 1500 万个 token,而 Claude Haiku 每分钟处理 126 万个 token,Gemini Flash 每分钟处理 400 万个 token。

  • 定价:GPT-4o Mini 更具成本效益,定价为每百万输入令牌 15 美分,每百万输出令牌 60 美分。Claude Haiku 定价为每百万输入令牌 25 美分,每百万响应令牌 1.25 美元。Gemini Flash 定价为每百万输入令牌 35 美分,每百万输出令牌 1.05 美元。

  • 可访问性:GPT-4o Mini 可通过Assistants API、Chat Completions API和Batch API访问。Claude Haiku 可通过claude.ai上的 Claude Pro 订阅、其 API、Amazon Bedrock和Google Cloud Vertex AI获得。Gemini Flash 可在Google AI Studio上访问,并通过 Google API 集成到应用程序中,还可在Google Cloud Vertex AI上获得。

在这次对比中,GPT-4o Mini 凭借均衡的性能、性价比和速度脱颖而出,成为小型多模态 AI 模型领域的有力竞争者。

GPT-4o Mini 与 GPT-3.5 Turbo:详细比较

本节将 GPT-4o Mini 与OpenAI 广泛使用的大型多模态 AI 模型GPT-3.5 Turbo进行比较。
  • 大小:尽管 OpenAI 尚未透露 GPT-4o Mini 和 GPT-3.5 Turbo 的具体参数数量,但已知 GPT-3.5 Turbo 被归类为大型多模态模型,而 GPT-4o Mini 则属于小型多模态模型。这意味着 GPT-4o Mini 所需的计算资源比 GPT-3.5 Turbo 少得多。

  • 模态支持:GPT-4o Mini 和 GPT-3.5 Turbo 支持文本和图像相关任务。

  • 性能:GPT-4o Mini 在 MMLU、GPQA、DROP、MGSM、MATH、HumanEval、MMMU 和 MathVista 等各种基准测试中均比 GPT-3.5 Turbo 有显著提升。它在文本智能和多模态推理方面表现更佳,始终超越 GPT-3.5 Turbo。

  • 上下文窗口:GPT-4o Mini 提供比 GPT-3.5 Turbo 的 16K 令牌容量更长的上下文窗口,使其能够处理更广泛的文本并在较长的段落中提供详细、连贯的响应。

  • 处理速度:GPT-4o Mini 以每分钟 1500 万个代币的惊人速度处理代币,远远超过 GPT-3.5 Turbo 每分钟 4,650 个代币的速度。

  • 价格:GPT-4o Mini 也更具成本效益,比 GPT-3.5 Turbo 便宜 60% 以上。它的成本为每百万输入代币 15 美分,每百万输出代币 60 美分,而 GPT-3.5 Turbo 的价格为每百万输入代币 50 美分,每百万输出代币 1.50 美元。

  • 附加功能:OpenAI 强调,GPT-4o Mini 在函数调用方面超越了 GPT-3.5 Turbo,从而能够更顺畅地与外部系统集成。此外,其增强的长上下文性能使其成为各种 AI 应用的更高效、更通用的工具。

底线

OpenAI 推出 GPT-4o Mini 代表着向更紧凑、更经济高效的 AI 解决方案的战略转变。该模型有效地解决了与大规模 AI 系统相关的高运营成本和能耗挑战。与 Claude Haiku 和 Gemini Flash 等竞争对手相比,GPT-4o Mini 在性能、处理速度和价格方面表现出色。它还展示了比 GPT-3.5 Turbo 更出色的功能,在上下文处理和成本效率方面具有显著优势。GPT-4o Mini 增强的功能和多功能应用使其成为寻求高性能、多模式 AI 的开发人员的不二之选。

来源:七元宇宙

编辑:Luke

(声明:请读者严格遵守所在地法律法规,本文不代表任何投资建议)

本文来源:元宇宙头条 文章作者:元宇宙头条
收藏
举报
元宇宙头条
累计发布内容523篇 累计总热度10万+
523篇 10万+
FTX 后院起火,Binance 釜底抽薪
FTX 后院起火,Binance 釜底抽薪
FTX 后院起火,Binance 釜底抽薪

元宇宙头条现已开放专栏入驻,详情请见入驻指南: #

免责声明:
1、本文版权归原作者所有,仅代表作者本人观点,不代表元宇宙头条观点或立场。
2、如发现文章、图片等侵权行为,侵权责任将由作者本人承担。

评论 共0条
默认
|
点赞
说点什么吧
相关文章
您需要登录后才可以回帖 立即登录