OpenAI发布全新系列o1大模型
北京事件9月13日凌晨,OpenAI发布全新系列o1大模型,分三个系列:
o1:性能最强,未正式发布;
o1-preiview:预览版,立即提供给ChatGPT付费用户和API用户;
o1-mini:擅长编程、更便宜的推理模型,成本较o1-preview低 80%。
最强推理模型性能大幅提升
o1系列是经过强化学习训练来执行复杂推理任务的新型语言模型,在数据分析、编码和数学等推理密集型类别中具有强大优势。相较于GPT-4o性能大幅提升:1)AIME考试:GPT-4o准确度为13.4,o1 preview为56.7,o1模型为83.3,高于美国数学奥林匹克竞赛分数线;2)GPQA Diamond:超越人类博士专家。
太阳定位:o1适用于在科学研究、软件开发、数学计算等领域解决复杂挑战,运用思维链处理复杂问题,强化学习能力,但目前暂不支持网络浏览、文件上传和图像处理等;GPT-4o更加全能,在自然语言处理,日常交流、文本生成等任务方面更具优势。
ScalingLaw增强算力需求将提升
o1模型特点是响应用户前会产生内部思考,能够通过不断训练(持续计算),完善思维过程,提升智能化程度,增强ScalingLaw逻辑。理论上随训练时长增加,模型内部思维链越长,智能化程度及推理准确度会大幅提升(算的越久越智能)。