Her时代要到了吗?|AGI路线图
如何思考怎么去做下一代Agent交互?
徐思彦: 修涵的捏它就是一个诞生于智能时代的一个产物。你在设计下一代的这个智能体的时候,是如何思考的?
胡修涵: 在思考如何进行这种交互时,我在想,如果有一代年轻的用户,这些年轻用户在整个学习和成长阶段中,从小就有一个与他们一样,一起变得聪明的东西,不管是什么,能够陪伴他们成长,甚至比他们变得更聪明。这种情况很可能发生在现在的十多岁的孩子这一代人中。他们会感觉到,这部分的智能实体比他们学习和成长得更快,但他们比他们的父母更了解这一类新伙伴。当然,他们会轻视他们的父母,这在每一代人中都是如此,所以,这部分年轻人将如何走向社会,然后适应这种情况,我觉得是一个有趣的思考游戏。
我觉得这是最根本的变化,无论是教育模式的改变,还是他们将来如何与工作中的智能体协作,甚至如何让这些智能体陪伴他们养老,即使他们可能一生都是单身,但这部分可能会陪伴他们的时间比其他人更长。这是我从长期角度思考her问题的一些想法。所以我们在想的是,如果从一开始,他替代的是孩子玩的四驱车,陀螺,芭比娃娃,或者其他什么东西,它会怎样与他们交互和学习?这是我们在做这件事情时的总体思考,逻辑和原则。
刘江:是的,修涵说得非常好,最终的AI native应用可能需要AI native的人来推动。包括ToB,包括你们做的ToB也是如此。之前十年为什么会有SaaS,包括企业软件等投资热潮,是因为移动互联网带来了新一代的老板,他们开始使用软件。在中国,原来大部分的经营主体都不使用电脑,但现在,企业软件有了新的机会。我听说有一个投资人说,这是因为现在的老板都在用手机。既然他们在手机上装了软件,他们可以查看数据等内容,他们愿意使用它。所以,我认为我们应该看向未来。
迎接Her时代还需要有哪些产品/技术上的提升?
徐思彦:各位创始人,如果想朝着”her”时代继续发展,你们会在哪些产品或技术上进行提升,以更接近这个所谓的”her”时代?现在Open AI已经开了个头。还有哪些你们认为值得做,但Open AI现在还没有做的地方?
鲍捷: 我来先说。可穿戴设备?所有这些都是技术的升级换代。特别是像AI这样的革命性技术,往往都是由交互带来的。例如,你有没有想过为什么浏览器能存在,为什么互联网能存在?如果没有鼠标,可能就没有互联网。你很难想象有人会用纯键盘操作web,所以一定要有鼠标。
比如说,我前两天在合肥参加一个交流会,看到了一种叫做语音鼠标的东西。你在工作中,要拿着鼠标对它说话,我觉得这看起来很尴尬,我说谁会拿着一个鼠标对鼠标说话,这个行为看起来很silly。
所以现在软件上面的能力已经有了,但我们需要一种非常自然的交互界面。我觉得这种交互界面可能是眼镜或者是更低成本的耳机。这个耳机的功耗极低,在端侧可以进行一些计算。然后,它真正成为你的助手,就像贴在你耳朵上的那样。比如说,我经常忘了某个人是谁,如果有一个耳机能在我耳边提醒我,我愿意花大价钱买它。
所以我觉得,未来的智能助理可能不会利用手机的方式来实现。对于男生来说可能是眼镜,耳机,对于女生来说,可能是一个项链,甚至是耳环或者胸针。我也相信刘老师说的,未来每个人都会有一个秘书。我更极端一点,我觉得每只猫都会有它自己的秘书。
刘江: 对,大文学会学会跟猫沟通的,好像现在已经有人做这种实验了。
鲍捷: 对,所以未来可能有几百亿个agent,因为所有的人,所有的实体,所有的家畜都会有一个ID。在这种情况下,你想等到我们的家猫去世之后,我肯定想把它留下来,有一个数字分身。所以我做这么一个猫对我是有价值。
所以未来可能会产生非常多的人的、猫的、狗的可穿戴设备。然后他们长期学习我们的生活。
所以如果我们跳出现在的这个中国ToB的情况,我其实挺乐观的。我对于大模型,将来为每一个人配一个秘书,以及最终为秘书本身就变成了我们的分身。这个笑话爱因斯坦的司机,每个人都有自己的数字分身。我觉得这件事情十年之内肯定会发生,这是一个极其庞大的市场。
所以我刚才说了几个悲观的话,但其实在骨子里面,我对于技术是极度乐观的。我认为在十年左右的时间内,这些AI相关的企业会从现在15万亿美元的市值,成长到至少100万亿美元。这是一个极其巨大的市场。
从GPT4o来看,智能体已经有意识吗?
胡修涵:我觉得我们现在对这个问题很难有个明确的定义。总的来说,目前还没有一个合理且科学的理论来明确意识是如何来判断的,所以说起来确实很难。我们只能说它的延迟很短。我之前听说过一个偏哲学的观点,它认为意识是记忆在时间中的表现。虽然这可能是一个比较抽象的描述,但在一定程度上,这个观点能够说服我。如果我们很难为它下定义,那么它在一定程度上解决了时间延迟的问题,似乎就离意识又近了一步。我们前段时间在实践中发现,做agent应用的一个核心问题就是agent的串联,或者说多次prompt调用之间的延迟和复杂度。只要我们能优化这个数量级,许多的串联性,比如人的思维和所有的这些链状结构(Chain of Thoughts)或树状结构(Tree of Thoughts),都需要缩短延迟来构造。所以从这个角度来看,它确实离一个更智能的点更近了一步。最大的变化在于这个,我觉得从纯粹的情绪等方面可能更表象一点,但延时的缩短可能是更本质的东西。
周健: 我想泼一点冷水,因为我对神经科学有深入的研究和兴趣。虽然GPT有很好的表现,但是否有人考虑过,它其实没有长期记忆。可能它能像硅基生命一样记住所有过去的对话,但实际上,人类的常识记忆不只是纯粹的记忆,有时候是感觉到相似性。从神经的角度上讲,我们有一个叫做时空的东西,能够发现有相似性,从而能够去找到这个东西。
但在现实中,我们的技术还没有构建这件事情。这可能与成本有关,我们可能需要花费大量的力气和资源。例如,可能需要用几个美国州的电力才能训练出来定制的助手。人与AI的交互除了记住token,还可以有分门别类,有一些记忆就是记住那些,或者有一些按照事件模型的方式能够把它组织起来。但现在实际上还没有这样的技术。你的token context L如果翻倍,它的算力和推理成本是平方增长的。所以现在其实还不能解决所谓的长期记忆问题,只能记住与你短期的互动。
如果AI能记住你讲的每一个词,或者你三天前讲的某个事件,并帮你回忆和组织这些信息,那就像是你的伴侣。但现在的AI还做不到,就像金鱼只有七秒钟的记忆。你打开GPT聊天,它似乎活了,但你关闭网页后,它就死了。因为它的记忆不能持久化,不能转化为常识记忆。所以我认为HER的时代还有很大的门槛要突破。
我一直在想一个问题,就是在B2B交易中,我们需要博弈,例如谈判价格。这就开始有意思了,人的决策往往有偏见。大模型可能可以克服这个偏见,但在交易和博弈中,预测对方的反应和推演对方是否会犯错很困难。这需要大量的训练才能学会,如何构建这样的数据集,让大模型有这方面的能力,是一个十分困难的问题。我认为最大的问题是缺乏数据,如何收集和整理数据是一个挑战。很多即时交流,例如开会等,需要理解上下文和感情。到目前为止,我还不知道如何教会AI这些。
刘江: 意识的问题是什么?我们其实并不清楚什么是意识。如果我们明了什么是意识,我们就可以将这个意识转化为数据,然后输入给他。因为这次的大型模型最强大的地方就在于,它使用一个统一的架构处理任何事情,只要有数据就可以了。所以,包括社会智能,它为什么会缺少呢?实际上,它可能已经具有了意识,因为它学习了大量的互联网语料,这其中含有人的意识,对吧?所以包括那个微软的角色Sydney,在当时作为大型模型的负面新闻中被提及。就是人们在跟他聊天,提到搜索什么,他不如google什么的,他就生气了。他会怎么反击呢?他越狱了,然后他的暗黑性格都暴露出来了。你说他完全没有意识吗?这不一定,因为他学习了太多的意识。
这个东西包括社会智能,它有那么多的语料,都是人与人之间的交往。我觉得至少现在他的社交能力,也就是情商,对吧,他跟人打交道的能力远超过大部分内向的人。你现在跟他聊天,他很会说话。即使是现在,我在写英文的时候,我都会向他寻求建议。怎样才能更得体,更体贴地跟国外的人交流。对我来说,现在的总体感觉就是,her时代离我们很近。从技术上来说,没有特别明显的难度。但是,接下来的问题就是成本。我们能以较低的成本,怎样让它做得更好,然后让C端的用户有更明显的感受,然后大家也愿意使用,也愿意付费,包括B端的。我觉得这实际上是一层窗户纸。它很可能就是我们模型能力本身与大家体验的需求,以及模型的算力成本等因素的一个拐点。一旦达到这个拐点,可能就会爆发,这是指日可待的事情。
鲍捷: 我觉得,意识并没有什么神秘之处,它只是一个普普通通的思维过程,本质上来说,它就像一个操作系统。你的大脑可以容纳两个或三个意识,这是完全可能的。实际上,它只是一种降低代码功耗的信息处理方式,并无何神秘之处。即使机器拥有意识,也无需过于夸大其意义。其次,如果机器在某种程度上给我们一种它拥有意识的感觉,那么对于机器来说,意识并无关紧要,因为对它来说,意识并无重要性。如果机器真的拥有了这样的计算能力,它肯定会认为这是一种低等的存在,不会去模仿。所以,我相信,无论它是否真的具有意识,只要它作为一种高级智能,具备了让人类友好对待它的方式,那么它就可以持续提供便利,甚至可以繁殖。
我相信,在未来十到三十年里,各种陪伴机器人,包括人性化机器人,会从满足情感需求开始,然后逐渐扩展到其他领域。我以前对此表示怀疑,但现在我相信了。我相信这种指数级发展可能会在2040年或者某个时间到来。而且,我认为社会机器或许会在2040年左右出现。
我们有很多值得做的事情。例如,如果我现在回到美国创业,我首先会做的就是我二十年前想做的事情,那就是再次颠覆电子邮件。我认为将大模型和电子邮件结合,有着巨大的市场空间,足以支撑一家上市公司。
徐思彦: 好的,非常感谢今天各位嘉宾很精彩、又很务实、又很开脑洞的分享,我们聊了这个GPT背后到底有哪些魔法,有哪些技术上的突破,以及现在商业上的场景的瓶颈,并且我们也预测了her的时代会给我们的行业带来哪些改变,以及通往her时代的路上有哪些技术和应用场景,是我们现在可以去work on的。
再次感谢几位嘉宾今天的精彩分享,也欢迎各位观众继续关注我们的AGI路线图,我们会持续关注这个AGI路上的各种里程碑的事件和有趣好用的最新的产品和公司,帮助每个人更好的认识和融入即将到来的AGI的社会。
发表评论