最新实测GPT-5-Codex:前端能力碾压,复杂项目轻松搞定,Claude可以扔了!

发表于 2 小时前 | 显示全部楼层 |阅读模式
190 5
来源:新智元

昨天OpenAI正式发布了GPT-5-Codex,一个专门为Codex编码智能体研发的GPT-5版本。
在看了全球网友实测效果后,基本结论就是可以告别Claude Code,放下Cursor,直接来拥抱Codex了!


为了验证网友们的说法和GPT-5-Codex的真实能力,我们全面的测评了一下。
确实这次OpenAI没有再喊「狼来了」,实测很多项目的效果都比较惊艳,比如一键秒出像素风格的小游戏。


或者,制作一个页面来展示强化学习里最经典的实验环境之一目标是让小车左右移动,同时保持杆子竖直不倒。


还可以几分钟秒出一个贪吃蛇游戏。


甚至,你可以给坤哥制作一个火柴人动画



你只需要上传一张经典的图片~


不过这个确实有点为难GPT-5-Codex了。
下面这张比较完美的还原了图片场景,但是动作识别错误,也不符合实际物理情形。


这张虽然动作符合,但是缺少一点精髓。。。


最后的效果就是这样子啦,等GPT-5-Codex再练习两年半应该就能完美生成了。


这次GPT-5-Codex的前端能力确实得到了非常大的提升。
随手制作一个记录每日AI精选新闻的网站。


Btw,有网友感叹,现在这个阶段,对于最前沿的程序员来,技术迭代的速度非常迅猛!
实际上,他们都不写代码了!
只是对Codex智能体大喊大叫(发号施令)就行,AI做一切!


而且,在GPT-5-Codex上线后,OpenAI发现需求实在过于猛了点!
运行速度竟然比预期的慢了2倍,现在OpenAI的研究员已经确认,重新补上GPU,算力再次起飞。
由此可见,确实好用,大家才会「疯狂使用」!


GPT-5-Codex实测
首先简单介绍下实测使用的方法,Codex官方提供了多种方式。
你可以使用npm安装在终端,也可以用扩展的形式在Cursor、VS Code等使用。


这次我们实测使用终端方式和Cursor中扩展的方式。








像素风游戏
在OpenAI Developers的官方账号上,给出了几个示例,我们就拿这些示例做一次测试。
首先是,「制作一个像素风游戏,让我可以四处走动、与村民交谈,并捕捉野外昆虫。」
以下是OpenAI给出的效果。


而下面是我们实测的效果。
「制作一个像素风游戏,让我可以四处走动、与村民交谈,并捕捉野外昆虫。」


玩起来还是很丝滑的。




手稿直出
还可以将手画的草稿,直接制作成一个网页。


这个效果还是很不错的,毕竟只有一张图和简单的提示。
「以这张图片为灵感,在此创建一个简单的 HTML 页面 aiera.html,包含所有资源/JavaScript 和内容,以实现该网络应用的展示版本。宜人的动画和响应式设计会很棒,但不要弄得太花哨」。






复杂项目
直接使用OpenAI开发者账号的草图,将这个图片制作为一个复杂的项目。
刚开始GPT-5-Codex给了一个和上面草图类似的HTML页面,所以我要求它使用nextjs框架重新制作。


最终的效果如下图所示,还是很好的还原了UI设计稿的页面布局。


在实测中也想感叹,自从有了AI智能体以后,写代码真的就是「大喊大叫」。
比如在实测GPT-5-Codex时,可以后台同步开启N个项目测试,这次ChatGPT给Plus和Pro用户的量还是很大方的。






贪吃蛇游戏
这次Codex提供的终端体验也非常棒,比如制作一个贪吃蛇游戏。


效果如下,Codex还是严格按照要求实现了。






飞行器
使用GPT-5-Codex也测试经典的「飞行器从火星飞往地球」的动画演示,整体GPT-5-Codex表现还行,能够让飞行器飞行。
当然这个模型并不是完美的。
我们在实测中发现,GPT-5-Codex生成的页面UI经常出现「堆叠」的情况,这个也得到了网友们的佐证。


这些都是小瑕疵,更重要的是:
当Claude Code还在偷给模型降智的时候,OpenAI为了实现更好的编程能力,专门给Codex更新了为编程场景特别优化的GPT-5-Codex,高下立判!


这次还是要支持奥特曼的!
彩蛋
而且GPT-5-Codex出来后不久,Grok 4宣布在AGI基准测试中取得了突破!
马斯克今天突然发帖说,他觉得Grok 5有可能实现通用人工智能,让我们拭目以待。
也许谷歌的Gemini 3和马斯克的Grok 5年底前就会给我们一个惊喜。


并且还有网友爆料Codex的提示词现已泄露,快来一探究竟吧!






       


                                                                                                                                                                               
                                                                                                                                                                        (声明:本文仅代表作者观点,不代表新浪网立场。)                                                                                                                                                       

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
全部评论
claude code 不仅反华还特别难用,换一个吧
2 小时前 ·回复
刚学会用 Claude code
2 小时前 ·回复
你想想,如果一个产品经理只给了一份初始文档,就交给100个开发人员去开发,什么都不过问,一年后回来能搞出什么?
2 小时前 ·回复
claude code 不仅反华还特别难用,换一个吧
2 小时前 ·回复
刚学会用 Claude code
2 小时前 ·回复
您需要登录后才可以回帖 登录 | 立即注册
发表评论
发布 联系QQ