OpenAI发布全新系列o1大模型

北京事件9月13日凌晨,OpenAI发布全新系列o1大模型,分三个系列:
o1:性能最强,未正式发布;
o1-preiview:预览版,立即提供给ChatGPT付费用户和API用户;
o1-mini:擅长编程、更便宜的推理模型,成本较o1-preview低 80%。

最强推理模型性能大幅提升

o1系列是经过强化学习训练来执行复杂推理任务的新型语言模型,在数据分析、编码和数学等推理密集型类别中具有强大优势。相较于GPT-4o性能大幅提升:1)AIME考试:GPT-4o准确度为13.4,o1 preview为56.7,o1模型为83.3,高于美国数学奥林匹克竞赛分数线;2)GPQA Diamond:超越人类博士专家。

太阳定位:o1适用于在科学研究、软件开发、数学计算等领域解决复杂挑战,运用思维链处理复杂问题,强化学习能力,但目前暂不支持网络浏览、文件上传和图像处理等;GPT-4o更加全能,在自然语言处理,日常交流、文本生成等任务方面更具优势。

ScalingLaw增强算力需求将提升

o1模型特点是响应用户前会产生内部思考,能够通过不断训练(持续计算),完善思维过程,提升智能化程度,增强ScalingLaw逻辑。理论上随训练时长增加,模型内部思维链越长,智能化程度及推理准确度会大幅提升(算的越久越智能)。

暂无介绍....

延伸阅读:

沥青日度基本面

1、9 月 19 日沥青期货下午盘收盘行情:主力 BU2411 合约下午收盘价 3131 元/吨,较昨日结算价上涨 20...

财醒来
2024 年 9 月 20 日
燃料油日度基本面

随着美联储 50bp 降息落地,国际原油价格跟随风险资产反弹,Brent 再度逼近 75 美元/桶关口,并对下游能化商品...

财醒来
2024 年 9 月 20 日
甲醇日度基本面

港口方面,甲醇太仓现货基差至 01+25,基差有所走强,西北周初指导价略有调降。卓创港口库存总量在 109.6 万吨,较...

财醒来
2024 年 9 月 20 日
硅铁日度基本面

昨日硅铁市场偏弱运行,宁夏72%FeSi自然块6000元/吨(-),府谷99.9%镁锭17750元/吨(-150)。成本...

财醒来
2024 年 9 月 20 日
锰硅日度基本面

昨日硅锰市场持稳运行,内蒙古FeMn65Si17出厂价5700元/吨(-80),天津港Mn45.0%澳块报价42.0元/...

财醒来
2024 年 9 月 20 日