Loan Database

Posted: **Mon Mar 17, 2025 3:01 am**

『你能看到Grok真的在做一些模糊思考，这样模型就不会被立即完全复制。』

图中可以看到，在数学测试中，Grok-3 Reasoning Beta和Grok-3 mini Reasoning的91分和96分，超越了o3mini的87分、o1的83分和DeepSeek-R1的80分。

同样在科学和编程两项中，Grok3两领先。

技术核爆点三：更多呈现模式
Grok 3不仅能解锁测试时间计算，还能启用强大的代理。这些能力促成了一款名为DeepSearch的新产品。“下一代搜索代理，用于理解宇宙”。DeepSearch还会展示它进行搜索时所采取的步骤。

不仅如此，Elon强调了Grok 3的创意华裔美国人数据涌现能力。在这个和DeepSeek十分相似的页面上，Grok新增了第三个标签按钮『Big Brain』。使用“大脑模式”，通过更多计算资源和推理来使用Grok 3，也许会呈现意想不到的效果。

未来Grok 3应该不太限制大模型的创作风格，以及思考创意的边界。相比之下，OpenAI则是解除了ChatGPT的成人内容限制，这就......

口水战打不完，奥特曼的反击
面对Grok 3的突袭，OpenAI并非毫无动作。

Loan Database

款模型也存在一定程度上的

款模型也存在一定程度上的