前几天说这些天一直很焦虑,其实是从去年11月份有点时间开始继续追踪新东西后就受到了一些冲击。因为有将近一年时间没有太跟踪最新的发展,所以现在 AI 能做到的程度还是大大超出了我的预期。
有一些认识:
-
现在越来越体会到算力是像水电一样的基础设施。之前都是嘴上说说,但实际上感受没有那么强烈。但现在,Agent 在帮你做事,已经可以自主完成很多事情了,但它消耗的就是 token,做什么事情首要考虑的就是token花了多少。这种计费有像水电一样的按量计费(API tokens),也有像宽带一样的包月计费(Coding Plan)。
-
中间的软件层越来越薄。1月份的时候参加过一个Agent 大会,有位演讲者说的很有道理。他说之前的软件像是“预制菜”,做好了给客户,每个客户拿到的都一样。而现在是“现场小炒”,每个客户随时都可以自己去编自己想要的软件。现在很多智能体平台都可以一句话生成一个智能体甚至一个应用,就能解决客户的一个需求。所以大模型底座和智能体平台这些会越做越好,越做越强大,客户可以根据自己需求自己做自己想要的东西,这样的话中间的软件层能做的东西就越来越少。
-
之前公司做的主要方向是智能客服、智能外呼、语音质检这类客服中心的智能解决方案,一直还挺得意自己革了客服坐席的命,让成本降了很多。现在突然发现,AI 编程工具在去年发展如此迅猛,是在革开发人员软件工程师的命,也就是在革自己的命。
-
之前曾经说过,LLM 只是概率系统,从现有的知识中学习,学到的东西只是体现了现在的世界是什么样子,再怎么折腾还是现在的世界。但是,几个方面的发展,已经慢慢走出了这个桎梏。
-
推理能力: 去年年初以 DeepSeek 为代表的大模型都在把推理能力(think能力)作为最重要的发展方向,这种把思考过程也加入到上下文中,让大模型确实获得了一些有别于之前的能力提升。
-
强化学习: 现在所有公网上的数据基本上都加入到预训练中了,那么没有数据后怎么办?强化学习也成为了新的学习范式,没有正确答案只有好坏的评价,让大模型自己在环境中去自行探索,这大大加强了突破现有知识限制的能力。还记得 Alpha Go的神之一手吗?如果没有强化学习,只是从现有知识中学习,大概是出不来这一手的。
-
AI 编程: AI 编程的发展,也是个关键因素。我们都知道在智能体体系中,工具的重要性(Agent = LLM + Memory + Tools)。因此 MCP 火了一阵。但 AI 的编程能力是最重要的工具,而且是元工具,也就是可以制造工具的工具。看到有时候给一个任务给智能体,它自己编写一些 python 代码来探索模型结构、从网上获取内容、把一些流程串起来的时候,心中确实很震撼。