微信扫码
添加专属顾问
我要投稿
你的ChatGPT升级了吗?
从昨天开始,不论是付费用户还是免费用户,不论是网页端还是app端,ChatGPT进行了一项重大更新:GPT-3.5
模型彻底退出历史舞台,取而代之的是一个名为GPT-4o mini
的新模型!
免费用户可使用GPT-4o
(有着约10条/3小时的使用次数限制)和GPT-4o mini
(免费使用)两个模型。
ChatGPT Plus用户可使用GPT-4o
(80条/3小时)、GPT-4 Turbo
(40条/3小时)和GPT-4o mini
(免费使用)三个模型。
这次GPT-4o mini
新模型的推出无疑是OpenAI针对竞争对手们展开的一次反击。不论是Anthropic还是谷歌,最近都有着亮眼的成绩,尤其是Anthropic,先是推出了Claude 3.5 Sonnet
这个Claude 3的升级模型,“智商”更高且成本更低,同时更新动作不断,发布了Artifacts这个使用体验极好的生成内容展示窗口,推出了Claude提示词库,以及在Anthropic控制台新增了提示词一键生成和评估优化功能,并且推出了Claude安卓app!而作为老大哥的OpenAI,自从今年5月13日发布GPT-4o
后就几乎“销声匿迹”,没有什么实质性的更新。无数人期待的GPT-4o
实时语音功能也是一鸽再鸽,遥遥无期。
北美时间7月18日,先是OpenAI开发者官方账号官宣了GPT-4o mini
模型的发布,表示该模型相比GPT-3.5 Turbo
更智能,成本更低。
随后OpenAI官方账号转发了这一帖子并表示GPT-4o mini
模型已经可以在API以及ChatGPT中使用。
GPT-4o mini
模型“Most cost-efficient small model-最具性价比的小型模型”,这是OpenAI官方给这个最新的GPT-4o mini
模型定下的宣传语。
作为最具性价比的模型,GPT-4o mini
的推出旨在让AI技术更广泛地可及。GPT-4o mini
在MMLU测试中得分82%,这一分数已经超过了GPT-4 Turbo 01-25
模型。价格方面,GPT-4o mini
比GPT-3.5 Turbo
便宜60%以上,其定价为每百万输入tokens 0.15美元和每百万输出tokens 0.6美元。该模型支持广泛的任务,具有低成本和低延迟优势,适用于调用多个API、传递大量上下文和快速响应客户互动等场景。GPT-4o mini
API目前支持文本和图片输入功能(多模态,这是GPT-3.5所不具备的功能),未来将扩展到视频和音频的输入输出。同时,GPT-4o mini
拥有128K tokens的上下文窗口,支持每次请求最多16K输出标记,并具备截至2023年10月的知识。
更高的“智商”意味着更高的文本智能以及更强的推理能力。GPT-4o mini
模型在学术基准测试中表现出色,超越了GPT-3.5 Turbo
和其他小型模型,并支持与GPT-4o
相同的语言范围。该模型在函数调用方面表现优异,使开发人员能够构建与外部系统交互的应用程序,并且相比GPT-3.5 Turbo
改进了长上下文处理能力。
推理任务:在涉及文本和视觉的推理任务中,GPT-4o mini
以82.0%的MMLU测试得分优于其他小模型,相比之下,Gemini Flash
得分 77.9%,Claude Haiku
得分73.8%。
数学和编码能力:GPT-4o mini
在数学推理和编码任务中同样表现出色。在MGSM测试中,GPT-4o mini
取得了87.0%的高分,而Gemini Flash
和Claude Haiku
分别为75.5%和71.7%。在人类评估(HumanEval)测试中,GPT-4o mini
的得分为87.2%,显著高于Gemini Flash
的71.5%和Claude Haiku
的75.9%。
多模态推理:在MMMU测试中,GPT-4o mini
也表现出色,得分59.4%,而Gemini Flash
和Claude Haiku
分别为56.1%和50.2%。
GPT-4o mini
API有多便宜?目前GPT-4o mini
模型的定价为每百万输入tokens 0.15美元和每百万输出tokens 0.6美元,这是一个什么概念,大约相当于标准书籍的2500页。同时OpenAI表示计划在未来几天推出GPT-4o mini
的微调功能。
当然,在ChatGPT中,免费、Plus和Team用户将从即日起可以免费使用GPT-4o mini
,以代替GPT-3.5
。企业用户将在下周开始开放访问权限。
GPT-4o mini
模型的推出,标志着GPT-3.5
时代的终结,全民进入GPT-4
时代。从AI技术的普惠性来看,这是一个必然,或早或晚而已。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-09-03
coze开源能力及与官方闭源版比较
2025-09-03
工业级AI平台开源,识别率超过99%,包含图像采集、智能检测、数据标注、模型训练四大模块
2025-09-02
Coze教程 | 第2章:Coze开发环境搭建与配置
2025-09-01
谁才是企业级开源平台的优选?OpenCSG与Dify、Coze、Langflow、Ollama 的差异化之路
2025-09-01
苹果深夜开源FastVLM:速度飙升85倍,0.5B小模型要逼疯谁?
2025-09-01
美团正式发布并开源 LongCat-Flash-Chat,动态计算开启高效 AI 时代
2025-09-01
突发,美团推出 560B 开源模型,名为长猫
2025-08-29
如何评测 AI 智能体:试试字节开源的扣子罗盘
2025-07-23
2025-06-17
2025-08-20
2025-06-17
2025-07-23
2025-08-05
2025-07-14
2025-08-20
2025-07-29
2025-07-12
2025-09-01
2025-08-16
2025-08-13
2025-08-11
2025-08-11
2025-08-06
2025-08-06
2025-08-06