[爱笔趣]ibiqu. v i p 一秒记住!
而外界的公众和投资者,则被这场「狼人杀」搞得热血沸腾,对即将到来的GPT-5发布会,期待值直接拉满。
「这肯定是GPT-5的预热!」
「OpenAI这是在憋大招啊!先用神秘帐号屠榜,然后发布会上直接揭晓,这剧本绝了!」
「我已经准备好充会员了!GPT-5快来吧!」
……
一周后。
万众瞩目的OpenAI开发者大会,如期举行。
舞台上,灯光璀璨。
山姆·奥特曼穿着标志性的灰色T恤,走到了舞台中央。
虽然他脸上挂着自信的微笑,但只有他自己知道,此刻他的手心里全是汗。
外界的期待已经被那个该死的「X」拉到了平流层。
所有人都以为他要掏出一个逻辑推理能力逆天丶能秒杀一切的「神级模型」。
但实际上……
「今天,我们带来了GPT-5。」
奥特曼的声音有些乾涩。
大屏幕上,GPT-5的各项参数和演示视频开始播放。
更快的响应速度丶更长的上下文窗口丶更强的多模态能力……
一切看起来都很美好。
但是,当演示到逻辑推理环节时,尴尬的事情发生了。
虽然GPT-5在GSM8K上的得分也提升到了85%左右,但在LogiQA和ProofWriter这种纯逻辑任务上,提升幅度却微乎其微,甚至在某些复杂场景下,依然会出现明显的「幻觉」。
更糟糕的是,为了强行提升逻辑能力,OpenAI在RLHF阶段引入了大量的逻辑数据进行微调,导致模型在日常对话中变得更加「机械」丶「冷漠」,失去了GPT-4那种讨人喜欢的「人情味」。
直播弹幕里,原本狂热的气氛开始冷却。
「就这?」
「那个屠榜的X呢?怎麽没看到?」
「感觉跟GPT-4没啥区别啊,甚至说话更像机器人了。」
「失望,退钱!」
……
发布会后的记者问答环节,气氛更是尖锐到了极点。
一位来自《纽约时报》的记者,直接站起来,抛出了那个所有人都想问的问题:
「奥特曼先生,最近在各大榜单上屠榜的神秘模型『X』,是否就是GPT-5的某个内部版本?为什麽我们在今天的演示中,没有看到那种令人震撼的逻辑推理能力?」
奥特曼的嘴角抽搐了一下。
他早就料到了会有这一问。
他深吸一口气,露出了一个高深莫测的笑容。
「关于『X』……」
他故意停顿了一下,目光扫过全场。
「我们OpenAI一直致力于探索AGI的边界。我们在内部确实有许多正在研发中的丶具有不同特性的实验性模型。」
「GPT-5是我们目前认为最平衡丶最适合推向市场的产品。至于其他的技术路径……」
他耸了耸肩,摊开双手。
「未来,一切皆有可能。」
这番话,说了等于没说。
既没有承认X是他们,也没有否认。
典型的「顾左右而言他」。
虽然公众对GPT-5的表现略有微词,但在奥特曼这番「画饼」操作下,OpenAI的股价在盘后依然坚挺。
只有奥特曼自己,回到后台后,瘫坐在沙发上,长长地叹了口气。
「这个X……到底是谁啊?」
……
🅘𝐁🅘𝑄u.v🅘𝑃