米兰体育官方网站 2025AI要大变样？从RLVR到锯齿智能，大佬直言未来趋势

AI圈子有新事发生。它不是普通的趋势预测。它来自AI领域的大佬Andrej Karpathy。他这次说的观点，直接讲AI训练，AI的本质，还有我们以后怎么用AI。他说得很清楚。比如“锯齿状智能”和能让AI训练快的RLVR技术，让人想知道为什么。

以前，我们训练大的AI模型，特别是会说话的AI，总有三个步骤：先用很多文字训练，然后用人标好的数据微调，最后用RLHF（人教AI）做好。RLHF听起来好，但它最大的问题是“人”。就像老师批改作文，不同老师给分不同。还有，没有那么多时间精力，去给很多AI数据做反馈。太依赖人的主观判断，限制了AI的成长。

但现在，叫RLVR的新技术出来了。它改变了AI学习的方式。以前，AI做完事要等“老师”打分。现在，它在一个能自己判断对错的地方学习。做数学题，用公式算就知道对错。写代码，运行一下就知道对错。玩逻辑游戏，只要规则清楚，对错就分明。

这种学习方式最大的好处是，奖励是机器自己给的，不用人管。机器不停工作，AI就能一直练习。一次不行就再来。很多次尝试都很正常。Karpathy发现，AI在不停试错中，为了得到奖励，会自己找到好的方法。它可能学会把难的数学题分成小步做。就算中间错了，它也知道回去改。这有点像人在思考。但也许它不理解自己在思考，它只是为了得到奖励。

Karpathy说了：“我们不是养动物，我们是在叫幽灵。”这话开始听不懂，但仔细它说了AI和人的智能有什么不同。人的智能是为了在危险的世界里生活，它要看很多，听很多，处理很多信息。所以人的智能很全面。AI呢？它在数字世界里，目标只有一个。它要么学人说话，要么在一个任务里得高分。就像玩游戏的人，它的目标就是通关。游戏外的事，它都不管。

这种只为一个目标出现的智能，米兰体育Karpathy叫它“锯齿状智能”。如果拿能力图来比，人的智能像高低的山。虽然有高有低，但整体平稳，能做很多事。AI的智能像心电图上的高点和低点。在一些方面（比如代码和数学），最好的AI比人还强。但在另一些方面，比如问它“为什么夏天穿短袖”，它可能不如一个小学生懂。这种AI只在一方面强的情况，让我们开始想，那些AI榜单是不是真的能说明AI的所有能力。

AI变得不一样，我们和AI互动的方式也变了。以前，我们直接用ChatGPT问问题，像问一个很懂的人。但现在，一些像Cursor的应用出现了。它们不再是AI本身，它们是AI和人之间的“中间人”。你可以把AI看作刚毕业的大学生。这些应用就像公司的HR。它们把AI招来，再训练，最后变成一个专门的团队。

还有，这些“中间人”会给AI工具。比如公司的私人数据，行业用的传感器，还有能做事的机器。这样，AI就不只是会说说。它能真正解决问题。Karpathy觉得，这个“中间层”的出现，跟AI每次升级一样重要。

另一件事是本地AI发展起来了。以前，AI多在网上运行，你问我答。但现在，像Claude Code这样的工具能装到你的电脑里。它能看你的文件，用你的电脑设置，甚至能用电脑命令。这就像你电脑里住了一个懂技术又努力的同事。你写代码它能帮你改，你处理数据它能用本地软件一起工作。这种关系，从偶尔用变成每天都在用。

编程也在变。以前，写代码要记住语法和函数。现在，“Vibe Coding”很流行。你只要说出你的想法，AI就能帮你写代码。你说“做一个能数Excel表里男女生数量的工具”，AI就能直接给你代码。这会改变“程序员”这个工作。以后，我们甚至会看到“LLMGUI”出来。它不用打字，直接用看的、用空间信息和AI互动。Google的NanoBanana模型好像就在研究这个。

{jz:field.toptypename/}

Karpathy这些话都说了一件事：AI不是我们认识的生物。它在数字世界里，为了一个目标出现。它的智能是特别的“锯齿状”。它有很强的优点，也有很大的缺点。我们以后用AI，就要看清并用好它的优点。也要给它建好像“中间层”这样的东西。他说我们现在用AI的能力，可能还不到10%。所以我们现在看到和想到的这些变化，可能只是个开始。

上一篇：米兰体育唐县金属缠绕垫

下一篇：milan 嘉兴市大型发电机本地发电机出租

你的位置：米兰体育官方网站 > 2026世界杯 >

米兰体育官方网站 2025AI要大变样？从RLVR到锯齿智能，大佬直言未来趋势

热点资讯

推荐资讯