两年前,GPT-4才出来的时候,大家纷纷给大模型出的题目是小学奥数,什么鸡兔同笼,都会有一定错误率,那时候人看大模型,就像看个傻子。
一年前,GPT-4o来了,模型变小了,性能提高,小学奥数以及普通的中考题正确率大幅度提高,但是中考的解答题仍然不会做。
半年多前,o1出现,首先提供的还是o1-preview和o1-mini,这两个模型已经能做中考解答题了,接下来只剩高考大题做不了。
然后今年,o3、o4-mini、gemini 2.5 pro……终于…。
{dede:pagebreak/}
江西通报救护车 800 公里收费 2.8 万「不合理,暂停医院转运服务」,该医院要承担怎样的法律责任?
为什么不趁以色列美国与伊朗打的火热的时机收复台湾的?
PHP和Node.js哪个更爽?
你在出租房屋发现过什么前租客留下的“宝藏”?
如何看待不超过1879元的Mac mini(M4+16/256GB+票),易用性吊打同级其他台式电脑?
女生真正的完美身材是什么样子?
为什么新流行的开源编辑器都在用Rust开发?
有一个***约你出去,你会去吗?
女明星做了什么医美项目保持童颜?
H264和H265谁画质好,求回谢谢!?
既然富人财富占社会总财富的 80%,那么鼓励富人消费不就可以了吗?
中国军事力量在亚洲能排第一吗?
女明星陪酒真的存在吗?
如何评价B站女主播“酒酿Lily王、Maggieyoo、水兵月野兔兔、CC宝玉玉、唐卡七”集体封禁?
为什么鸿蒙PC要排斥Linux生态?
Golang与Rust哪个语言会是今后的主流?