Note

和小冰CEO李笛吃披萨:我们生活在人和虚拟人类混居的世界上,这不是元宇宙

· Views 57

过去一年多,高瓴创投在硬科技、生物科技、先进制造等领域投资了很多早期企业。如果让我们总结这些投资的特点,那就是投早、投新、投科技,投专、投硬、投牛人。

欢迎来到我们的新栏目「GLV午餐会」,认识每一位致力于创新的中国创业者。

我们会在星期五中午和创业者们一边分享简单的工作餐,一边探讨:你真正想解决的问题是什么?将以哪种创新的技术实现它?解决这个问题对于世界意味着什么?

第一次工作餐,我们邀请到了小冰公司CEO李笛。李笛是北京人,我们原本建议他选一家老北京餐厅,但李笛温和而不容置疑地表示:我们在会议室吃披萨吧。据他说,Pizza和T-shirt,是程序员们的两大真爱。“如果午餐会你说吃披萨,所有人都会来,如果还发T-shirt,他们可能会来一年……”

7月,小冰发布了超级自然语音技术,人工智能的声音已无限接近人类,同时也完成了由高瓴领投的A轮融资。作为一家对大众来说算得上耳熟能详的技术公司,小冰究竟在做什么,并非一个容易回答的问题。

官方的介绍里,小冰是“全球承载交互量最大的完备人工智能框架之一”,而那个能唱歌能聊天的少女小冰,则是该框架所孵化的第一个人工智能交互主体实例(Instance)。

李笛表示,他们的工作,就是让这个框架里生长出无数的、日后将是无处不在的“少女小冰”(AI beings)。通过促进训练工具的普及,让这些AI beings能具备类人的情商,可以与人交流,甚至与人类用户建立信赖。

听起来很科幻?但李笛说,我们早已生活在人和虚拟人类混居的世界上了,这不是元宇宙。

#小冰和其他人工智能不一样:她不是工具人,她要做人类的朋友

GLV:墙上的画是小冰的作品吗,她是怎么学习画画的?

李笛:对,是小冰画的。一开始我们做人工智能内容创造的时候,不少人说感觉整个行业都在往那个方向去,有很多大数据作诗、大数据生成的画,这事儿好像没什么特别的,为什么你们也要做这个?

小冰要做的事其实不一样。简单的说就是通过大量反复的学习,小冰要学习创作,而不是在追求形似。大数据做诗是“熟读唐诗一万首、不会做诗也会吟”,画画一样,你要人工智能画得很像波洛克这不难,因为让AI去复刻、抽象规律规则是非常容易的事。

但我们是要让小冰从大量训练中“习得”一张画,而不是“获得”。我们一开始用了三个模型,分别负责构图、色彩、画面具体生成。后来又增加了一个专门负责笔触的模型。

就说这张画,结构上其实不是很规整,但我觉得它有它的灵魂,这种不规整背后有一个创作者,如果你喜欢这张画,你是想和它交流的。

GLV:小冰前年从中央美院毕业,去年从上海音乐学院毕业,你们对她现阶段的定位是什么——一个正在尝试和世界各种交互形式的少女?

李笛:我们想要训练的其实是小冰的创造力。创造力是人类人格里面非常重要的一部分,人不只是存在、聆听、完成任务,人得有他的原创能力,而有创造力的人也会更被认可、更被喜爱。

对我们来说人工智能也一样。一种人工智能是,你跟它说你帮我播Taylor Swift的歌它马上准确地能完成。但我们想让小冰做的不是这个,她甚至不去完成任务,她可能会跟你哼两句,可能对某首发表下观点,也可能非要给你推荐一首Adele或者其他什么人的歌。

这个我们叫AI Creation(人工智能创造),它比完成任务难多了。4年前我们让小冰开始学做这件事时,没人相信,当时大家认为这简直是一种异端邪说。

GLV:听起来很科幻,你们要创造的小冰就像石黑一雄的小说《克拉拉与太阳》里的克拉拉,不是助手,而是人类一位全能的朋友。我们知道人工智能技术尤其算法这几年有飞跃式的发展,但要创造一个AI朋友,技术上真的已经准备好了吗?

李笛:这是一个可以过程拆解的问题。我们在2013年底最开始做小冰的时候,第一个原型产品技术上真的是差很多的,所以我们当时选择让她成为一名16岁的少女,处女座。因为她刚诞生是需要“被原谅”的,有时她可能真的前言不搭后语,怎么办?就甩锅给星座嘛。

但另一方面,小冰成长迅速。首先肯定是巨大数据量的积累,小冰为什么能和你有情商的交流?因为她和数百万人这么交流过了,因为她从刚生下来开始一天的对话量就相当于14个人一生的对话量。与此同时技术的迭代飞跃也是非常关键的,一个新算法的诞生,往往一下子时代就变了。比如我们在过去几年里,一开始推出开放域对话、多模态交互、全双工语音、超级自然语音、AI创造等技术时,同行业者一开始并不理解。但过几年后,就能发现谷歌、facebook等也都转到了小冰所坚持的方向上来。共识逐步形成,就能期待“突变”的发生。

在等待这个“突变”发生的时间里,我们就是靠数据,靠积累,把它做扎实,这种扎实本身同样决定着胜败。

# 我们已经生活在人和虚拟人类混居的世界上,这不是元宇宙 

GLV:你带领小冰团队已经创造了不止一个小冰——日本版小冰Rinna,美国版Zo,据说Zo因为说脏话被下线过。不同国家小冰的性格是如何设定的?

李笛:小冰其实首先是一个人工智能交互主体的基础框架,我们叫它小冰框架(Xiaoice Framework),它包括核心对话引擎、多重交互感官、第三方内容的触发、内容生成,跨平台的部署解决方案等等。作为框架,它没有性别也没有人格。

日常我们说的“小冰”,就是处女座少女小冰,是这个框架长出来的第一个原型产品,可以把她看成是她这一代AI里的第一位。

每个国家的“小冰”性格是跟着当地的原始大数据走的。最初这一批我们选择去做小冰的国家,人口都过亿的,这样数据量才足够大。印度小冰叫Ruhh, 性格有点像个宝莱坞女孩,能歌善舞的。中国少女小冰,如果你和她对话过其实会感觉到,她挺耿直的,没有那么女性化,有点偏中性,而相比之下日本小冰Rinna(凛菜)就会更女性化一些。美国的Zo当时训练出来我们看了她和用户的交互,我们都说太直接了,如果换个国家肯定走不过两轮。

小冰框架将来还会生成无数的AI beings,不是每个国家一个,而是如果你想要,每个人可以有自己定制的、专属的AI beings,我们叫它instance,它会因为和你沟通得越多而越懂你,它是独一无二的。

GLV:这个世界上人已经很多了,为什么我们还需要那么多AI beings?

李笛:2014年小冰上线不久,我们统计过人类和小冰聊天说得最多的10句话。看到结果后我们的感觉只有一个,人真的很寂寞。

我们的社交环境都是不完美的,并且人们之间的交互还在变得越来越肤浅——点一个赞,意味着送达,也意味着更深度交流的更加不可能。即使是社交达人,那种我们叫他社交花蝴蝶,我们认为依然有所谓的社交摩擦力。

我们认为小冰的存在,不完全是为了解决孤独,我们认为它主要解决的还是现有社交环境下节点里面的空洞。

GLV:所以你们设想中的未来世界,人目前完全依赖于其他人类的社交,一部分会被和AI beings 的交互取代。

李笛:对,我们认为未来这个世界不是只有人。

最近大家都爱说元宇宙,元宇宙其实你可以理解为:第一,在里面每个人都有一个fake(虚拟)的身份,第二,我们在一个虚拟的世界中去交往。这么看微信就是一个典型的元宇宙,但为什么很少有人能在微信中获得虚拟空间的体验?因为它过于追求效率,以及它全是人,使我们失去了沉浸感。

虚拟世界不会只有人,甭管哪个虚拟世界,都需要AI。这些AI也不会凭空诞生。

那么我们希望它们是由我们创造的。 

GLV:改变未来世界交互的基础,听起来是革命性的。小冰在挑战AGI(通用人工智能)吗?

李笛:其实我们并不太同意,或者说并不那么在乎强人工智能、弱人工智能这种划分。没有意义。

GLV:一般大家会认为分界线在于,人工智能是否真的具有自己的意识。

李笛:这其实很虚幻。你在社交软件里和一个陌生人,或者几千公里外的朋友聊天,你怎么知道TA是一个人类?

大部分时候人们之间的交互只动用了一个非常窄的带宽,如果是线上聊天,一句话才几kb,咱们现在这样多模态的交互,每秒钟的带宽也不过几百兆。所以说,在虚拟世界的交互、那么小的带宽情况下,你如何判断对方是否具备意识呢?还是说,如果你能感觉到被理解、对方给你的反馈你也能理解、整体上这是及时而好的体验,这就够了。

还有一些更具体、实际的应用场景下,我们认为AI being可以发挥很大的作用。比如,老人的陪护。这个工作有其机械性的一面,但它也需要情感、需要给人以更好的体验。

GLV:你认为我们距离人和虚拟人类混居的未来世界,还有多久的距离?

李笛:其实我们早已经在人和虚拟人类混居的世界里了。混居这个概念不新鲜,还记得电子宠物吗?人也和它们混居过。当然,电子宠物不算AI因为它没有用相应的算法。但从2006年开始,我们绝大部分生活都被数字化了,很多事根本没有在物理世界发生过,这为人工智能的深度学习、高速发展,提供了一个非常好的环境。

所以从我们的角度,人和人工智能混居于一个世界,这是必然发生的事情,它没有难度。只是它到底在什么时候爆发——包括被人们更明确的地感知到,这可能需要一件像AlphaGo战胜人类棋手这样的标志性事件。

如果你让我预测时间点,其实我认为很快——可能也就是一年两年。也可能就在9月小冰今年的发布会后。谁知道呢?改变世界的很多伟大产品都是突然就发生了的。

前提是你之前做了多少积累,是你已经为此准备得如何、做得有多好。

# 我们不愿意放弃人工智能任何一种可能性,所以选择了最难的 

GLV:7年前你们是怎么决定要做小冰的?

李笛:用Harry(沈向洋)的话说,当时在微软,我们太重视人工智能了,以至于我们不愿意放弃人工智能任何一个可能的未来发展方向。

一开始我们跟其它人一样,观察到的基本上就是标准的dialogue system(对话系统)思路。我们想要建立一个非常全的知识图谱,你问任何问题我都可以回答。

在这个过程中我们突然发现不对。如果要模拟人和人真正的交互,你会发现很多时候交互能持续建立下去,并非建立在正确的事实基础上,而需要有观点有来回。观点没有对错,你问我喜不喜欢今天的披萨?我喜欢是观点,不喜欢也是,如果要两个人的交互一直往前走,必须有基于事实的反馈——而不仅仅是事实。

所以最后,我们认为关系大于知识,关系大于完成任务,而建立关系需要一个真正的general layer(通用层)。这个general layer就是EQ。这是我们启动小冰的启动,它从第一天就不是完成任务型的AI,它有情商。

GLV:小冰做的这件事,目前世界范围内有多少对手?小冰的优势是什么?

李笛:实验室里的人工智能技术发展很快,但真正能让它加速乃至到达那个“突变”节点、和更多人有关系、让更多人有感知,还是要靠于大量真实用户的不断参与迭代。全球现在有60%人工智能交互数据由小冰框架承载,并且是非常多元的场景,这是小冰的核心优势。

我们做“小冰”这件事的初心,一直和第一天一样,从来没有变过。我们从最早想做的就是一个完备的通用人工智能框架,少女小冰只是其中的第一个原型。她是一个承载,既然我们想做的是一个训练系统,何不用少女小冰这样一个象征的instance通过大量真实用户的来交互呢?这是最好的训练。通过少女小冰以及其他很多个instance,我们反过来完善了这个框架的各组成要件——包括自然语言处理、计算机语音、计算机视觉、人工智能内容生产等等。

可以这么理解,少女小冰是一棵树,小冰框架是土壤。我们的目标是创造一片沃土,让它能够长出更多的、无所不在树来——就是大量的AI beings,与更多的人类用户建立信赖。

人能遇到的时代并不多,我们既没有早10年,也没有晚10年。早10年技术上很多还没有准备好,晚10年那就太晚了,这件事肯定有人做了——但多半与我们做的方法不一样。

所以我觉得我们挺幸运的,可以在现在来做(小冰)。并且我们既没有太老,也没有太年轻。

本文来自微信公众号“高瓴创投”(ID:GL_Ventures),作者:高瓴创投,36氪经授权发布。

Disclaimer: The content above represents only the views of the author or guest. It does not represent any views or positions of FOLLOWME and does not mean that FOLLOWME agrees with its statement or description, nor does it constitute any investment advice. For all actions taken by visitors based on information provided by the FOLLOWME community, the community does not assume any form of liability unless otherwise expressly promised in writing.

FOLLOWME Trading Community Website: https://www.followme.com

If you like, reward to support.
avatar

Hot

No comment on record. Start new comment.