查看原文
其他

OpenAI o1 可能只是个Agent

关注进群👉 金融圈小伙伴 2024年09月14日 11:33

我看那个视频演示,感觉就像是个反问模式的Agent在那儿表演。

特别是那个问草莓有几个"r"的场景,我心想,这有啥好夸的?

难道就为了凑数?

还有那个写小游戏的场景,我期待的是那种3.5到4的震撼感,结果呢?

剪辑痕迹明显得我都不知道该说啥好了。

前天gpt4o的负责人离职了,我猜肯定有更深层的原因。

不止我一个人这么想,下面一堆评论都在问和Agent有啥区别,看来大家都有点失望。

不过说实话,如果能把4o like的价格打下来,我还是会佩服的。

200刀一个月买个万能Agent,听起来也挺划算的,就是那些单纯做Agent的人要吃苦头了。

我大学的高数期末考试题,拿给它测试,结果全对!

根据我搜集的信息和别人的测试,我猜他们可能收集了大量OI题和高中数学竞赛题做合成数据或RL。

其他领域的性能可能没啥大改进。

(官方博客没提合成数据,只说了scale RL训练计算,但RL rollout和合成数据的界限也不明确。)

要真是这样,那最近1500亿的估值,我咋感觉有点是为了套现跑路的节奏呢?

Agent现在是个筐,啥都能往里装。

除了协作,其他都是多余。

自我反思一下,做了几个审查机器人互相监督,所以慢了点。

就硬卷应用层,我觉得gpt4之后就没真正提升推理能力了。

ilya走了,这玩意早就上了死刑名单。

继续滑动看下一个
金融圈小伙伴
向上滑动看下一个
选择留言身份

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存