『你能看到Grok真的在做一些模糊思考,这样模型就不会被立即完全复制。』
图中可以看到,在数学测试中,Grok-3 Reasoning Beta和Grok-3 mini Reasoning的91分和96分,超越了o3mini的87分、o1的83分和DeepSeek-R1的80分。
同样在科学和编程两项中,Grok3两领先。
技术核爆点三:更多呈现模式
Grok 3不仅能解锁测试时间计算,还能启用强大的代理。这些能力促成了一款名为DeepSearch的新产品。“下一代搜索代理,用于理解宇宙”。DeepSearch还会展示它进行搜索时所采取的步骤。
不仅如此,Elon强调了Grok 3的创意 华裔美国人数据 涌现能力。 在这个和DeepSeek十分相似的页面上,Grok新增了第三个标签按钮『Big Brain』。 使用“大脑模式”,通过更多计算资源和推理来使用Grok 3,也许会呈现意想不到的效果。
未来Grok 3应该不太限制大模型的创作风格,以及思考创意的边界。相比之下,OpenAI则是解除了ChatGPT的成人内容限制,这就......
口水战打不完,奥特曼的反击
面对Grok 3的突袭,OpenAI并非毫无动作。