Grok-3或许是最聪明的人工智能 但马斯克不能高枕无忧
【CNMO科技】2月18日,马斯克旗下的人工智能公司xAI举办了一场新品发布会。此次发布会的主角是xAI公司最新研发的AI大模型——Grok 3。

在正式发布前,马斯克就曾公开放话,Grok 3是“地球上最聪明的人工智能”,其推理能力将超越包括ChatGPT和DeepSeek在内的其他领先AI模型。当然,嘴炮谁都能打,是骡子是马,还得牵出来溜溜。
惊艳亮相
在发布会上,xAI公司宣布将推出Grok 3的两个版本:功能全面的Grok-3和针对低计算场景优化的Grok-3 mini。其中,Grok-3可以为用户提供更加智能、高效的体验,其包含了全套功能如DeepSearch、Think和Big Brain等。而Grok-3 mini则通过针对低计算场景的训练,旨在满足更多场景下的应用需求。

据xAI公司分享的基准测试结果显示,Grok-3及其精简版Grok-3 mini在编码、数学问题解决以及科学推理等关键任务上的表现均优于OpenAI的GPT-4、Gemini、Claude和Deep Seek等业界知名模型。
在备受瞩目的Chatbot Arena(LMSYS)排行榜中,早期版本的Grok-3凭借出色的表现成功登顶,获得了1400分的最高分,力压Gemini 2.0 Flash Thinking、DeepSeek等强劲对手。
尽管xAI相对于谷歌或OpenAI等业界巨头而言仍算是一位新兴势力,但Grok-3所取得的这些性能数据无疑是一项令人瞩目的成就。
高效、透明与全面
在Grok-3问世后,其强大的功能和卓越的性能引发了广泛讨论。作为一名科技爱好者,我也获得了在有限时间内免费试用这款AI聊天机器人的机会。通过亲身体验,我对Grok-3有了更深入的了解和认识。
初次接触Grok-3时,其简洁而直观的用户界面给我留下了深刻印象。无论是通过移动设备上的X应用程序,还是直接在网页上访问x.com/i/grok页面,我都能轻松地与Grok-3进行交互,这对用户非常友好。

Grok-3目前提供了两个核心功能:Think和DeepSearch。Think功能为Grok-3的交互增添了推理能力,使其能够像DeepSeek的DeepThink、谷歌的Gemini 2.0 Flash Thinking Experimental以及OpenAI的o系列模型一样,为用户提供更加智能和高效的体验。而DeepSearch则相当于xAI的Deep Research工具,它为用户提供了一个强大的知识收集和处理平台,使得用户能够轻松获取所需信息。
在试用Think功能时,我感受到了Grok-3在推理方面的强大能力。我曾询问Grok-3关于微软新量子计算芯片的相关性问题,Grok-3不仅迅速给出了回答,还展示了其全面的思考过程。它不仅关注到了量子计算芯片的科学应用和潜在好处,还指出了与之相关的风险和挑战。
相比之下,我之前使用过的Gemini AI在回答类似问题时显得更为克制和学术化。虽然Gemini也提供了详细的分段细分和引用材料,但其答案往往更加抽象和理论化,使得用户难以理解和接受。而Grok-3在解释复杂术语时则采取了更加自由主义的方法,使得答案更加易于理解和接受。这种人性化的回答方式无疑会增强用户对Grok-3的好感和信任度。
在体验DeepSearch功能时,Grok-3的表现也相当出色。与Gemini Deep Research需要等待批准研究方法不同,Grok-3在我提交问题后立即开始执行任务。它不仅汇总了所有相关的知识库,还通过实时编译的数据进行推理,最终以综合报告的形式呈现给我。这种高效的处理方式让我在短时间内获得了大量有价值的信息。
值得一提的是,Grok-3在呈现答案时非常透明。我可以看到收集和寻找答案背后的详细思考过程,包括整个过程的阶段范围细分和实时进行的数据处理。这种透明度不仅增强了我对Grok-3的信任感,还有助于我更好地理解其决策逻辑和推理过程。这种开放和透明的态度无疑是Grok-3在AI领域赢得用户信任的重要因素之一。

当然,Grok-3也存在可以改进的地方。例如,在DeepSearch功能中,我无法在代理搜索开始之前编辑研究计划。这在一定程度上限制了我的灵活性,使得我无法根据实际需求对研究计划进行调整和优化。此外,虽然Grok-3在回答大多数问题时都表现得非常出色,但在某些特定领域或复杂问题上,其回答可能还不够深入和全面。这些问题虽然存在,但并不影响我对Grok-3整体性能和用户体验的认可。
竞争与挑战
尽管Grok-3的表现相当出色,但AI领域的竞争日益激烈,Grok-3仍面临着诸多挑战。在当前AI代理这一新兴领域中,Deep Research并非一枝独秀。OpenAI推出的Operator能够通过控制Web浏览杂务来代表用户执行复杂网络任务。同时,OpenAI还与多家企业达成合作,将Operator打造成具有广泛影响力的AI代理典范。
OpenAI还推出了ChatGPT插件系统,通过与多家平台的集成,进一步增强了聊天机器人的功能。相比之下,Grok-3在插件系统和合作伙伴拓展方面尚需努力。

与此同时,来自中国的DeepSeek也凭借其DeepThink思考和推理产品搅动了华尔街。目前,DeepSeek已经被多家公司所采用,在中国拥有极高的市场影响力。这些竞争对手的存在无疑为Grok-3的市场推广带来了更大的挑战和不确定性。
-
人工智能拓展服务消费新场景
日前,国务院印发了《关于深入实施“人工智能+”行动的意见》,将“人工智能+”消费提质作为一项重点行动进行部署,明确多项举措拓展服务消费新场景。近年来,服务消费作用愈加凸显。根据国家统计局发布的数据,2024年我国服务业增加值占国内生产总值比重为56.7%,对国民经济增长的贡献率达56.2%。然而,服2025-09-12 07:19:00 -
最新通知!事关长治供暖!
注意啦! 2025~2026年度集中供暖缴费工作即将启动 大家近期要留意 小区内张贴的供热缴费通知 在规定时间内交清取暖费 逾期未交费的用户 供热部门将按规定关闭供热阀门 告 知 尊敬的用户您好: 为了提高供热服务质量,方便用户缴纳热费,我公司按区域设立了多处供热服务大厅,并与中国工商银行、中国农业2025-09-10 17:13:00 -
全面检验供热设备与设施!郑州热力:将启动第二次冷态运行
尊敬的热用户:暑退秋澄,绿城焕彩。当时令步入金秋,郑州热力集团有限公司2025-2026年供暖季各项准备工作有序推进中,诚邀您提前规划冬日温暖。当前,为确保今冬供热系统稳定高效运行,热力集团上下全面开展供热系统的检修与保养工作。8月中旬组织实施首次供热管网冷态运行,排查并消除隐患。9月中旬将启动第二2025-09-10 11:54:00 -
协同发展谱新篇丨雄安新区中关村科技园:当好京津冀产业协同“纽带”,激活区域发展新势能
冀时客户端报道 9月8日至9月10日,由中共河北省委网信办、中共北京市委网信办、中共天津市委网信办联合主办的“协同发展谱新篇”网络主题宣传活动正式启动。9月8日,记者走进雄安新区中关村科技园。园区位于雄安新区容东片区华望城南部地块,一期二期合计总面积约14万平方米。以人工智能、数字科技、生物技术、低2025-09-09 17:46:00 -
山东推出中小学人工智能教育“十大行动”,力求未来3-5年实现五大突破
日前,山东省教育厅等6部门印发《中小学人工智能教育“十大行动”的实施意见》,聚焦基础教育阶段,对高质量推进人工智能教育作出系统部署。省教育厅有关负责人进行了解读。为何要专门推出中小学人工智能教育“十大行动”?省教育厅有关负责人表示,山东省推出中小学人工智能教育“十大行动”是应对人工智能时代教育变革的2025-09-04 12:06:00 -
【百家民企说】软通动力夏杰:未来企业或成为能自我进化的生命体
中新经纬8月29日电 (谢婧雯 常涛)“不再仅靠人的经验运营决策,而是一个能够自主感知、决策、执行并实现自我进化的生命体。”2025数博会期间,软通动力高级副总裁夏杰在接受中新经纬专访时,描绘了他对未来智慧企业形态的畅想。软通动力夏杰 受访者供图“数聚”是“智启”的基础公开资料显示,软通动力20052025-08-29 11:49:00 -
国家发展改革委:深入实施“人工智能+” 坚决避免无序竞争和一拥而上
北京商报讯(记者 金朝力 程靓)8月29日,国家发展改革委高技术司副司长张铠麟在新闻发布会上表示,围绕《关于深入实施“人工智能+”行动的意见》,国家发展改革委将进一步加大统筹,与各方一起共同努力,形成合力。在实施行动过程中,将推动各地立足区位特点、资源禀赋和产业基础,科学确定发展重点,形成各具特色、2025-08-29 11:32:00 -
赶紧卸载!这38款App被通报
注意,38款移动应用存在违法违规收集使用个人信息情况被通报,赶紧看看你的手机里有没有↓↓↓依据《网络安全法》《个人信息保护法》等法律法规,按照《中央网信办、工业和信息化部、公安部、市场监管总局关于开展2025年个人信息保护系列专项行动的公告》要求,经公安部计算机信息系统安全产品质量监督检验中心检测,2025-08-28 15:37:00