米兰体育官方网站 2025AI要大变样?从RLVR到锯齿智能,大佬直言未来趋势

发布日期:2026-01-23 18:48    点击次数:96

米兰体育官方网站 2025AI要大变样?从RLVR到锯齿智能,大佬直言未来趋势

AI圈子有新事发生。它不是普通的趋势预测。它来自AI领域的大佬Andrej Karpathy。他这次说的观点,直接讲AI训练,AI的本质,还有我们以后怎么用AI。他说得很清楚。比如“锯齿状智能”和能让AI训练快的RLVR技术,让人想知道为什么。

以前,我们训练大的AI模型,特别是会说话的AI,总有三个步骤:先用很多文字训练,然后用人标好的数据微调,最后用RLHF(人教AI)做好。RLHF听起来好,但它最大的问题是“人”。就像老师批改作文,不同老师给分不同。还有,没有那么多时间精力,去给很多AI数据做反馈。太依赖人的主观判断,限制了AI的成长。

但现在,叫RLVR的新技术出来了。它改变了AI学习的方式。以前,AI做完事要等“老师”打分。现在,它在一个能自己判断对错的地方学习。做数学题,用公式算就知道对错。写代码,运行一下就知道对错。玩逻辑游戏,只要规则清楚,对错就分明。

这种学习方式最大的好处是,奖励是机器自己给的,不用人管。机器不停工作,AI就能一直练习。一次不行就再来。很多次尝试都很正常。Karpathy发现,AI在不停试错中,为了得到奖励,会自己找到好的方法。它可能学会把难的数学题分成小步做。就算中间错了,它也知道回去改。这有点像人在思考。但也许它不理解自己在思考,它只是为了得到奖励。

Karpathy说了:“我们不是养动物,我们是在叫幽灵。”这话开始听不懂,但仔细它说了AI和人的智能有什么不同。人的智能是为了在危险的世界里生活,它要看很多,听很多,处理很多信息。所以人的智能很全面。AI呢?它在数字世界里,目标只有一个。它要么学人说话,要么在一个任务里得高分。就像玩游戏的人,它的目标就是通关。游戏外的事,它都不管。

{jz:field.toptypename/}

这种只为一个目标出现的智能,米兰体育Karpathy叫它“锯齿状智能”。如果拿能力图来比,人的智能像高低的山。虽然有高有低,但整体平稳,能做很多事。AI的智能像心电图上的高点和低点。在一些方面(比如代码和数学),最好的AI比人还强。但在另一些方面,比如问它“为什么夏天穿短袖”,它可能不如一个小学生懂。这种AI只在一方面强的情况,让我们开始想,那些AI榜单是不是真的能说明AI的所有能力。

AI变得不一样,我们和AI互动的方式也变了。以前,我们直接用ChatGPT问问题,像问一个很懂的人。但现在,一些像Cursor的应用出现了。它们不再是AI本身,它们是AI和人之间的“中间人”。你可以把AI看作刚毕业的大学生。这些应用就像公司的HR。它们把AI招来,再训练,最后变成一个专门的团队。

还有,这些“中间人”会给AI工具。比如公司的私人数据,行业用的传感器,还有能做事的机器。这样,AI就不只是会说说。它能真正解决问题。Karpathy觉得,这个“中间层”的出现,跟AI每次升级一样重要。

另一件事是本地AI发展起来了。以前,AI多在网上运行,你问我答。但现在,像Claude Code这样的工具能装到你的电脑里。它能看你的文件,用你的电脑设置,甚至能用电脑命令。这就像你电脑里住了一个懂技术又努力的同事。你写代码它能帮你改,你处理数据它能用本地软件一起工作。这种关系,从偶尔用变成每天都在用。

编程也在变。以前,写代码要记住语法和函数。现在,“Vibe Coding”很流行。你只要说出你的想法,AI就能帮你写代码。你说“做一个能数Excel表里男女生数量的工具”,AI就能直接给你代码。这会改变“程序员”这个工作。以后,我们甚至会看到“LLMGUI”出来。它不用打字,直接用看的、用空间信息和AI互动。Google的NanoBanana模型好像就在研究这个。

{jz:field.toptypename/}

Karpathy这些话都说了一件事:AI不是我们认识的生物。它在数字世界里,为了一个目标出现。它的智能是特别的“锯齿状”。它有很强的优点,也有很大的缺点。我们以后用AI,就要看清并用好它的优点。也要给它建好像“中间层”这样的东西。他说我们现在用AI的能力,可能还不到10%。所以我们现在看到和想到的这些变化,可能只是个开始。