起源:陈赫回应约请李晨上五哈作者:
对话EverMind:4个月做到SOTA,要给所有Agent装上持久影象
作者 | 吴瑞琪邮箱 | rachelwu@pingwest.com
“人类智能 = 推理 + 持久影象”。。
当AI 推理能力的较量进入白热化,整个行业起头意识到:infra层面的影象缺失,正成为限度 AI 走向个性化与自进化的最大瓶颈。。
没有持久影象的 Agent,就像一个固然考上了清华、但每天醒来都不意识亲妈的天才。。而大量涌入影象赛道的公司,好多性质上只是在做向量数据库,把数据存起来,等人来检索。。
EverMind 想做点不一样的。。这家由盛大集团孵化的公司,定位是为所有AI Agent提供一个通用的"影象层"(Memory Layer)。。它的主题产品EverOS是一套开源的持久影象系统,开发者能够把它接入自己的Agent,让AI不仅能记住用户的汗青对话和偏好,还能像人一样对影象进行整顿、更新,甚至从从前的经验中学习和进化。。
EverMind的CEO邓亚峰,是一位在AI领域深耕二十余年的老兵。。他毕业于清华大学,曾任360集团副总裁兼AI钻研院院长、格灵深瞳CTO,在推算机视觉、多模态AI和AI制药等领域深耕多年。。2025年,他参与盛大,带队从零启动EverMind的持久影象项目。。团队仅用四个月就在多项影象评测上达到了SOTA。。
我们与邓亚峰进行了一次对话,聊了聊他为什么押注持久影象,以及这项技术到底要解决什么问题。。以下是对话实录,为阅读履历稍作编纂。。
为什么是 Long-term Memory(LTM)
硅星人:在视觉、多模态、AI制药这些领域都做到过很好的成就之后,您是怎么锁定"持久影象"这个方向的??
邓亚峰:做AI制药的时辰我最大的体味是,当数据产生得慢、不能急剧迭代,技术进取就是有限的。。所以之后选方向,我就想找一个能急剧做数据迭代闭环的领域。。也思考过机械人,但落地周期太长、数据获取难题。。转向说话模型之后,又面对大模型在吞噬所有的问题。。OpenAI、Anthropic车轮滔滔,创业公司的空间越来越小,必须找到一个有独个性的细分赛道。。
持久影象刚好满足这几个前提:它是下一代AI的必备个性,钻研得很少,跟推理能力相对正交,有很强的战术独立性。。其时这个方向相对冷门,各人还在做LLM模型、Agent、post-training,但我以为没有影象职能的Agent,用户履历肯定是受限的。。今天这已经成了行业共识。。
盛大这边的视角也很怪异。。陈天桥先生从前十多年一向在sponsor脑科学和mental health 的钻研,对人类智能的机制机理极度感兴致。。这几年AI的发展让他起头思虑一个问题:人类智能刚好能够简化为“推理+持久影象”,推理这一半已经有无数巨头在卷了,持久影象是不是一个极具战术独立性的方向??这个判断和我自己的思虑刚好吻合。。
硅星人:在您看来,Long-term Memory到底要解决什么主题问题??
邓亚峰:三件事。。
第一,突破有限的高低文长度。。此刻模型高低文窗口根基到了1M token,但影象数据量超过这个限度就没法用了。。现有的RAG或压缩规划都是工程妥协,不是最优解。。我们做memory,性质上是帮模型更好地治理高低文,在极高压缩率、低token亏损的前提下,让模型有效利用无限的汗青信息。。
第二,实现真正的个性化。。人在互换中会为对方成立profile:身份、偏好、价值观、说话风格、指标。。LTM就是帮Agent构建和守护这样的用户画像,交互越多越懂你。。当然,LTM的个性化设置不仅限于Profile Memory。。
第三,Self-evolving,自进化。。今天的AI靠offline training提升能力,在和用户交互的过程中并不会变得更聪明。。我以为下一代AI肯定是在交互中学习的,是一种online learning。。Long-term Memory是实现自进化的关键:通过纪录和分析交互的成功与失败,总结最佳实际,知识和思虑方式都随之进取。。
这三件事和人类进化出持久影象的道理是一样的。。远古时期,哪里水草丰茂你要记住,哪里有危险你也要记住,同时你还要凭据季节和气象去预测将来,这片草地会变得更湿润还是会发洪水。。并且钻研批注,持久影象援手人类组织训练样本,把分歧经验分类聚合,所以人的泛化能力远强于模型。。模型是把所罕见据不做分辨地扔进去训练,很容易过拟合,或无差距求概率。。人脑的持久影象机制让学习更有结构,泛化更强。。AI的Long-term Memory要做的,性质上也是这件事。。
Memory Layer 和 Agent 层
硅星人:您提到的个性化和自进化,听起来更像Agent利用层的职能,不像infra layer能做的事??
邓亚峰:这是一个很好的点。。Infra layer能做一部门。。我们最近在做一个即将开源的feature,基于memory的自进化。。分歧Agent把运行的trace放到我的memory里,我能够凭据成功和失败的经验去总结最佳SOP。。好比你做了一个工作成功了,我做了一个类似的工作失败了,当我把大量用户的经验堆集下来,就能够learn from experience。。这在影象层是能够做到的。。
若是想做得更深,好比基于用户反馈做强化学习,那的确必要Agent层和Memory Layer协同。。但Memory Layer在其中表演关键角色:帮Agent层组织数据,就像人脑持久影象辅助学习的机制一样。。
硅星人:在您看来,接入Memory Layer,Agent最直观的智能提升体此刻哪??
邓亚峰:四个维度。。
第一是效能,token的极致压缩。。这对节制成本至关重要。。若是zbo智博1919com产品能让token数极端降落,这件事的贸易价值是极度大的。。
第二是成功率。。我们做了基于skill的自进化机制,Agent能够从从前经验中学习,某些指标实测提升了234.8%。。好比你昨天用一个职能可能还会失败,但这两天有几小我也用过了,系统学到了其中成功的经验之后,你今天再用就成功了。。系统会变得越来越好。。
第三是个性化。。分歧用户有分歧的高低文和影象,每小我的助手履历都唯一无二。。我们内部有个AI Native的合作平台叫Tanka,提供基于持久影象的AI助手。。背后的LLM和推理技术是一样的,但由于每小我的影象分歧,聊出来的成效就齐全不一样。。
第四是自动性。。纪录了用户的行为汗青之后,Agent能够预测下一步需要。。好比我知晓你每天这个时辰要买杯咖啡,我就能够提前提醒你。。再进一步,我甚至能够提前把事件做了,再问你"这是不是你要的了局??"就像一个能预判需要的好员工,你没有assign的工作他已经做完了。。
影象怎么更新,怎么"健忘"
硅星人:我用GPT时时遇到这个问题:我的生涯已经更新了,但它对我的理解还停在之前。。好比之前跟它聊过的人事物,在我现阶段的生涯里已经不重要了,但它还总是提起,就让人感触很烦。。EverMind怎么处置影象的矛盾和过期信息??
邓亚峰:zbo智博1919com机制分两步:在线提。。∣nline Memory Extraction)和离线进化(Offline Memory Evolution)。。
在线提取,信息进来后做boundary detection,把统一topic的内容聚到一路,提取事实性的情景影象(episodic memory),再预测这个事实对将来的影响,我们叫forecast。。影象不只是存档,要能服务于将来的决策。。
离线进化,系统定期做几件事:在更大领域信息上提炼用户profile;做反思和刷新,有点像Claude Code里"dream"做的事,让模型回头审视之前的判断对不合;还有处置影象更新,通过影象聚类战术(merge),把类似话题聚在一路,矛盾信息按功夫线用最新的做update。。
忘却率直讲是更难的。。Update相对容易,用最新的信息代替老的就行。。但忘却有一个周期性的问题:你昨天提到一小我,系统感触他重要;一星期前呢??一个月前呢??是不是就该忘了??我们此刻是在离线战术中把每条信息的功夫放进去,结合zbo智博1919com预测将来职能,让模型自己去揣摩这条信息的时效性。。率直说,在当前这个功夫点还没有做到极度梦想,但我以为它是一个会被逐步解决的问题。。
我的判断是:AI的"忘却"不应该是物理删除,数据存在磁盘上不贵,而是一种权重调整战术。。近期信息权重高,远期信息权重低,但必要时仍能找回。。人类为什么必要忘却??两个原因:一是人脑是低能耗系统,记太多器材能耗扛不。。欢是你必要基于近期信息做决策和预测。。AI不存在第一个限度,它只必要在决策中把时效性和重要性合理思考进去。。从这个角度说,AI的忘却机制现实上能够比人类更优。。
开源生态与大厂竞争
硅星人:EverOS已经在GitHub上开源。。但OpenAI、Anthropic也都有自己的影象职能,用户已经堆集了好多偏好数据在他们的平台上。。第三方Memory Layer怎么找到自己的地位??
邓亚峰:zbo智博1919com定位是做一个memory layer for agents,将来所有Agent都必要影象职能,但没必要每个团队都自己建一套infra。。我们但愿成为那个协议数。。
大厂肯定会做影象,但第三方影象层的空间来自一个单一事实:用户不会只用一个产品。。你不会只用Claude,也不会只用OpenAI。。你在各个产品上的汗青信息都有价值,所以反而必要一个真正属于自己的跨平台影象治理工具。。这件事的驱动力是用户必要,不是我们想做还是大厂想做。。
别的,memory治理不必要最顶尖的大模型。。我们用4B的模型能做到235B级此外成效,更快、成本更低。。对开发者来说,memory将来不是"能不能"的问题,而是性价比的问题。。
开源战术上,我们极度彻底:开源版和本地部署等价,数据齐全留在本地,满足隐衷要求高的用户。。同时也有云版本,让不想自己部署的小团队即插即用。。最主题的算法全数开源。。我们也在做一件事,帮用户把Claude Code、OpenAI和其他Agent里的memory数据买通,跨平台、跨端、统一治理。。跟好多人聊完发现,这是一个很刚的需要。。
硅星人:记住的信息越多,安全风险也越大。。这方面怎么平衡??
邓亚峰:两个层面。。信息安全,也就是影象会不会泄露,这跟云服务的安全挑战是等价的,必要扎实的技术保险。。另一个是系统要对敏感信息做过滤。。好比用户通知你密码、银行账号,我们有个vault机制,把高敏感信息隔离存放,只在特殊情况下激活。。
部署模式上,影象的梦想状态是云端和端侧结合。。用户的数字资产存在本地设备上,复杂处置借助云端,双方做同步。。zbo智博1919com模型已经能够做得很小,将来设备能跑4B模型,推算就能够齐全数署到端上。。
若是 AI 记住了你的所有
硅星人:若是AI占有了极度长周期、极度精确的影象,它就不再只是工具了。。您但愿您的AI助理记住什么,不想让它记住什么??
邓亚峰:我感触将来最梦想的状态有两种。。一种是"贾维斯",24小时随着你的AI,你的工作和意图都通过它实现,它只必要你确认了局。。另一种是数字分身。。AI足够相识你之后,能够代表你去"打工",或者做Agent社交。。我们每小我都有好多两年都不座谈天的伴侣,但彼此可能有值得互换的信息。。人是串行的,AI是并行的,你的数字分身能够和他的数字分身谈天,发现共同话题了来通知你,"你们两个应该聊聊这件事儿。。"这让我感触极度exciting。。
至于记什么、不记什么,梦想的AI要有天堑感和情商,知晓哪些话题在感情上是敏感的。。不外有意思的是,人和AI的相处有时比人和人更容易,你天然以为AI跟你是一壁的,反而更愿意倾诉一些不会跟伴侣说的事件。。
硅星人:我对memory有个感触:它有点像人类对功夫感知的演变。。在腕表遍及之前,你出门之后其实不知晓此刻是几点几分了,对功夫只有一个:母兄。。而此刻有了手机,你能够随时随地知晓此刻的功夫。。而人类目前对影象的感知,就像腕表出现之前人类对功夫的感知水平。。您感触,若是AI有了精确的持久影象,人对自身经历的感知会不会也产生类似的转变??
邓亚峰:这个比喻非:。。此刻的人类就像钟表刚发现时的状态,对自己做过什么有大体感知,但不精确。。若是AI能长周期地精确纪录和治理你的小我数据,人对自我的相识会上升到一个此刻无法设想的水平。。
并且AI的影象能力能够添补人类的一个先天限度:人的能量有限,所以有人善于宏观规划,有人善于细节,很少有人两样都强。。但AI的Long-term Memory能够既帮你梳理三年来的大事脉络、做更有远见的规划,又能在你必要时精确调出三年前某个时刻的具体细节。:旯酆臀⒐勖缆岷,这是AI在memory上真正让人兴奋的处所。。
点个“爱心”,再走 吧
@谢得琪:梭哈游戏下载官方,湖北一新娘不要彩礼 公交车当婚车@曾以天:七连冠!国乒女团逆转日本
@于思秋:陈赫回应约请李晨上五哈
热点排行
- 1 必发体育外围
- 2 乐橙电竞在线
- 3 光芒娱乐官网首页入口下载
- 4 乐彩vip客户端登录
- 5 电子牛牛官网
- 6 在线下注平台
- 7 银河app下载安装
- 8 仲博平台在线登陆下载
- 9 bbin超级厅下载