涂子沛:情感可以被量化,未来摄像头可能是物理建筑的一部分
涂子沛
近期,《大数据》一书作者,前阿里巴巴集团副总裁涂子沛的新书《数商》上市。
与一般的科技类图书不同,书中通过精心选择的历史故事介绍了人类应用数字最终发展出现代科学和工业文明的过程,从而向读者引出当前的大数据、智能时代中,人们应如何用数字思考和行动。
书中,涂子沛以“智商”、“情商”类比,提出了“数商”的概念,并表示人类文明正从以文字为中心转变到以数据为中心,进入“数文明”时代,“数商”是新时代的竞争中脱颖而出的关键。
涂子沛向澎湃新闻记者表示,在中国社会,目前大数据已经赋能给了公司、政府,但却没有清晰地赋能给个人,他表示,“如果我们每个人都能提高‘数商’,那就意味着我们每个人都能加深对数据的理解、提高对数据的驾驭和使用能力,让数据在个人生活当中发挥更大的价值。”
涂子沛曾在美国学习、工作多年,2014年从硅谷回国,出任阿里巴巴集团副总裁。2018年创建数文明科技,同时担任伊斯佳股份董事、人民网和国地科技独立董事。著有《大数据》《数据之巅》《数文明》《给孩子讲大数据》《给孩子讲人工智能》等作品。
以下是涂子沛与澎湃新闻记者对谈实录(经编辑):
澎湃新闻:感觉《数商》这本书就很像是一本科普读物。你为什么想到写这本书,希望这本书能起到什么样的作用?
涂子沛:说科普读物肯定没错,但我也愿意把它列为一本文化读物,因为我努力的一个方向就是希望把数据这个科技话题变成一个文化话题。科技的话题可能关心科学技术的人才会关心,但事实上我认为每个人都要去关注数据,数据也是一种文化现象,所以只有这个数据变成一个文化现象的时候,我们的思维方式生活方式才可能发生改变。这是第一个层面。
第二个层面为什么要写这本书呢,我们有一个词叫大数据赋能。我们很清楚地看到,大数据赋能给了很多公司,很多公司通过大数据优化了自己的运营,赚了更多的钱;也赋能给了政府,政府通过大数据很好的控制了疫情,提高了社会治理的能力;但是我们没有很清楚地看到在中国社会大数据赋能给了个人。如果我们每个人都能提高数商,那就意味着我们每个人都能加深对数据的理解,提高对数据的驾驭和使用能力,让数据在个人生活当中发挥更大的价值。所以要解决一个时代的问题,就是大数据怎么去赋能个人,因此我希望从个人的生活、个人的价值观理念这些方面去阐述数据的价值。
澎湃新闻:但是大数据这个概念给我的印象里,它应该是海量的数据,作为你刚刚所说的赋能个人的数据,它可以用大数据这个词吗?
涂子沛:当然可以。在今天这个时代,每个人都是在海量的数据当中取一瓢饮的,但你要找到你合适的那一瓢。世界上的知识、事实、信息是无边无际的,你要知道怎么去获取信息。今天信息都是以数据的形式存在的,我们要找的数据它就在互联网上,但是有些人找不到,有些人能找到,而且人们快速查找的能力不一样,这是一件今天很头疼、很很棘手的事儿,所以我在书里面总结了大概11条信息搜索的方法,帮你找到海量数据里的那一瓢在哪。
我们现在每个人都关注上百个公众号,但是你都会看吗,事实上你们不看,当时认为他有用,事实上证明他没用。你能不能找到你要的信息这个是很要命的,是因为数据太多了。所以你要找到你喜欢吃的东西,你要找到你喜欢的人,都很难。这些今天可能都是以信息的形式存在的,你要在信息的层面上先找到。
比如说广州有成千上万个餐厅,可能事实上有一个餐厅,他做的菜是你最想吃到的,但是你根本就不知道它的存在。找女朋友找对象,你怎么判断对方合不合适,你怎么知道她的存在?当我们会用数据去做搜索做分析的时候,你的面就大多了,在物理世界当中一个个去碰,你一天能碰几个人?但在信息空间里,你可以成千上万的人做快速的筛选,但是你必须掌握这种能力和方法。就像我们在阿尔法狗下棋一样,阿尔法狗一天可以下几万盘棋,但1人可能只能下几盘棋,这个基数是不一样的。
澎湃新闻:我平时在生活中会遇到有的朋友没有数字概念,甚至连金钱概念都没有,这个时候我想要劝说他们去记账就很困难。如果是你的话,你会怎么劝他们从记账开始,多掌握一些处理数据的能力?
涂子沛:事实上我认为“数商”的一个重要的维度就是善于记录,记录就是把信息变成数据的一个过程。困扰我们人类的问题实际上很多人认识的并不清楚。比如说我们会忘记,但其实忘记不是问题,我们不知道我们忘记这才是问题。无知也不是问题,我们不知道自己无知这才是大问题。越无知的人他对自己感觉越好。因为他知道少,他就自己感觉好,所以我们怎么才能减少这种问题的产生,那就是记录。
我们大脑的能量是有限的,某种程度上你可以说是无限的,因为你装的东西太少。等装太多的时候你就知道它会把一些东西挤出来,然后你就会忘记。记录是在为我们的大脑建立一个体外的存储器,存储器起到补充的作用,校正的作用。今天当然这个体外的存储器可以是在电脑,把你的记录全部变成电子笔记,你就可以很快的找到。我们大脑其实也是一格一格放东西的,放多了它就乱了,这时候你有一个外部的数字化记录,能帮你解决这些问题。一个不会记录的人,它可能就像一首没有曲谱的音乐,是随性而做的,懂得记录,才能在记录的基础上不断地沉淀,不断地提高,不断地优化,所以记录它是个基础。所以我把记录认为是“数商”最重要的维度。
澎湃新闻:现在有一些企事业单位,员工正式上班的时间都在摸鱼,把事情都留在本应该下班后的时间加班来做,这种情况算不算是管理者缺乏管理能力?
涂子沛:在中国这个独特的发展阶段,加班不能一概而论。很可能是缺乏管理能力,8小时之内没用好,然后要来加班。这就是公司的管理机制有问题,他没有一个很好的方法去评定管理他的绩效。
我讲到过一个东西叫“工时管理系统”,每个人每天做的工作都被记录下来。在国外的很多软件公司他们都有这个记录体系,每天下班的时候总结你今天干了啥。
比如,我在一个项目上花了两个半小时,另一个项目上画了一个半小时,我还花了30分钟就上厕所和休息,8个小时填满了之后,这个数据放在数据库里,部门经理就可以分析每个人:我这个经理要管4-5个项目,每个项目的进度是多少,每个项目现在有多少高级程序员、中级程序员、花多少工时、他们的成本是多少、我的项目收益是多少。每天都有图表在对比,而且能很好地看到进度跟成本。比如到今天为止,这个项目已经有三个高级程序员花了一共150个小时在上面。还有一个初级程序员花了30个小时在上面,成本是多少,项目预算是多少,我还能花多少小时,我现在处于什么样的地步,我要调配什么样的人员。
进行对比、知道自己处在什么样的位置,你的绩效就会更加清晰,整个公司又不一样了,它是处在不同的计算跟管理的过程当中,所以绩效管理应该是这么去管。但是我们国家的很多公司都没有这种工时管理系统,叫timesheet。
你刚刚也讲了对金钱怎么管对吧?我觉得“数商”另外一个表现就是不仅会管钱,管成本,还要会管时间,这个刚刚举的加班这个例子就是管成本和管时间。
管时间也是用这种方法,市面上有很多书都在讲怎么帮助你管理时间,核心的方法就是量化。很多人不会用这个方法,时间都去哪了他不知道。如果你每天都做时间管理,那就很清楚地知道自己的时间去哪了,用了多少时间在哪里,比如我今天做了三件事,三件事加起来才4个半小时,还有3个半小时在哪?那3个半小时可能就是低效的时间、无效的时间,就是可能被浪费了的时间。我们如果不去量化它,我们可能每天就是混混噩噩。所以掌握记录的方法,量化的方法是整个“数商”的核心。事实上个人我觉得就是几件事儿,你要会管时间,要会管钱,还要会管理你的社会人际关系。
澎湃新闻:书中你讲到了几个通过数据的方法来找到伴侣的案例。这一点其实也很有意思,我们可以理解婚姻它是一种社会化的行为,我们会讲究门当户对,很多指标是要用量化来体现的。但是说到情感或者感情这种东西,它是否是可以被量化的?
涂子沛:我认为完全可以被量化。并不是它不能被量化,我们缺少的是合理量化的方法。那首歌怎么唱的,“你问我爱你有多深,我爱你有几分?”“有多深”、“有几分”也是要量化它,但是我们缺乏量化的方法,所以我们歌里会唱“月亮代表我的心”,因为我没有好的办法去量化它,我们只能说“比天还高,比海还深”。今天随着科学的发展,一切都在数据化,我们会发现可量化的东西,可遵循的东西会越来越多,我们看到今天所发生的一切社会关系、社交,都在被量化。
你发了多少条朋友圈,你跟每个人每天用了多少时间在微信上对话,你送过他多少次花,你送过他多少次巧克力,你给他点过多少次赞,这些都可以统计。很多太太对先生说你很久没送过花给我了,你很久没给我点个赞,你很久没有拥抱过我、没有亲过我了,你很久没有牵过我的手,你很久没有说过你爱我了,但是这个很久到底是多久,它是可以量化的。
你这个月牵过几次手,亲过几次脸,拥抱过几次,很多女性会有个初步的印象,觉得你好像一个月都没亲过我两次了,但是具体几次她也说不清,这是因为记录手段的匮乏,但是我们今天有各种各样的手段来记录,我们甚至未来可能在家里的客厅里就有一个摄像头,这个摄像头可以分析每天男主人微笑了多少次,女主人微笑了多少次。
澎湃新闻:你觉得这样的收集有必要吗?
涂子沛:未来的生活可能摄像头就是物理建筑的一部分,未来人都会适应这种生活,这个摄像头可能在建房子的时候就建好了,当然你可以把它关掉,但是在某些情况下它可能是有作用的。
因为我们人类一个最重要的问题是我们不知道自己是个什么样的人,你太太可能会告诉你你三天都没有笑过两次,但事实上你不知道你三天没笑过两次,你在家里老是板着脸。其实很多男人是这样的人,但他们不知道,当然也有很多女人,她们有她们的事情。所以我们今天人类的问题就是我们事实上无法感知我们自己,今天这种外部的数据也好,各种人工智能也好,它可能能帮助你来感知你自己。你可以选择在某种情况下不需要它们的帮助,但是事实上技术今天提供了一种手段。未来在5G的基础上,人类被提供了一张感知的网络,5G将会是一张感知网。
在没有这种手段之前,你可以这样批评一个男性但他可以不接受,但是数据告诉他你三天没有笑两次,他就会反思他的生活、他的价值观、跟太太相处的方法、跟家人相处的方法,因为这是一个事实。这个事实原来是没有办法量化的。现在这种量化在某种程度上对感情、对社交、对一个人的个性都有影响,我感觉它能促使别人的觉醒。它提供了一种新的手段,能够促使我们更好地去认识自己、认识他人,也认识爱。当我们认识了新的问题的时候,当我们对爱,对自己对他人有更本质的认识的时候,生活就会更加美好,这也可能会带来新的问题,但从来生活就是这样。
澎湃新闻:现在的社交平台,尤其是信息流平台,他们会利用算法推荐用户喜欢的内容,但是另一方面也导致过去开放的互联网现在越来越封闭,不同人群之间的壁垒越发加深,你认为为什么会造成这种情况?
涂子沛:一个核心的原因,最直接的原因实际上是我们的屏幕变得越来越小了,今天的手机屏幕是针对一个人的,所以它导致了推送信息的个性化。
我们所有的公司都在做个性化,要给你推送个性化的信息,每个人获得的信息、看到的新闻都不一样,这个不一样的基础是什么?是基于你以前的行为,你以前是个什么样的人,我就给你推什么样的信息,造成信息越来越窄,这是一个问题。
怎么去打破这个问题呢?我觉得主动性还是在人这里。你要去看更多的信息,看不同的信息,因为你不看不同的信息,算法就会越来越狭窄。当然算法是一方面,但是根源还是在个人的行为,因为你就被投喂了,你就吃这一种食物,那算法就会觉得你最喜欢这种食物。如果你主动去改变,主动去看其他的新闻,算法才会觉得你也对这个感兴趣,再推送你其他的新闻。
我觉得我们今天的人生活在了这样一个投喂的信息时代里面,但是人不能满足于被投喂。有些人他很享受这种投喂,看到的信息都是他想看到的,他就喜欢这个调调,那他就是个问题。所以我们说最关键的是人不能带着一口井,走到哪儿还是一样坐井观天。如果你就喜欢这个调调,你就是带着一口井的,你先用这个井把一切东西筛选了。
澎湃新闻:你觉得按照现在的技术趋势,我们还有可能回到以前PC时代开放的互联网环境中吗?
涂子沛:其实互联网是开放的,只不过是我们人习惯被投喂了。互联网上所有的信息都还是存在的,只不过你没想去获得它,你不会主动去找数据。现在是什么数据给到你,你就拿什么样的数据,你不会主动去找。今天这样一个时代为什么你要有“数商”?因为它就是你个人的主体性,如果你被投喂,你就丧失了你的主体性,如果你主动去找去搜索,互联网上所有的东西都在,只是你找得到找不到。
每个人能力是不一样的,有些人永远不去找,他就满足于他看到的东西,而且他看到的东西就构成他的认知基础,他认为这就是他的真理。有些人不是这样的,有些人看到新闻他会质疑这新闻的真实性,他会去找、去比对,但有些人不会。
澎湃新闻:最小限度的收集数据也是大数据时代的原则之一,但是现在确实是国内有一些数据收集过多的情况,你认为应该要如何改善比较好?
涂子沛:政府和公司现在都认识到了数据的价值,所以他们在能收集数据的时候,都拼命地收集数据,这要彻底的改变,只能靠政府立法,说哪些数据在什么情况下可以收集,哪些数据不能收集,哪些部门可以收集,哪些部门有些数据是不能收集的。
对政府来说,可能政府要去规划整个社会的数据收集体系。现在我们看到的往往一个政府部门收集过的数据,另外一个政府部门又来重复收集,每个部门都想收集了归自己。收集来收集去,存在各个地方,用也没用好,连也连不起来,每个地方收集的都不太一样,造成全社会数据资源的巨大浪费。最终解决这个问题是要靠立法的,对政府的行为,对企业的行为进行规制。我们建设大数据社会不到10年,数据发展的法制环境,是我们今天要去关注去研究的,让大家都意识到这个问题的存在,唤起大众对这件事情的关注。
事实上我们会在数据里进行划分,有一些数据它是跟私人身份相关的,有一些是跟个人敏感行为有关的,对这部分数据的采集是要慎重。个人身份的数据不是随便都能采集,也不是随便哪一个企业都能够采集个人的敏感数据,这些还是要立法,要有规可循,现在是无规可循。
现在所有的公司只要能采集的都在采集,采集了它也没保存好,再被黑客攻击了,就造成了大量这样的数据泄露,比如说酒店开房的信息经常爆出来泄露了,里面又有身份证信息,又没有加密等。归根结底它是一个法制的问题,也是个技术的问题。除了要去完善立法,还要采用更多的技术手段,比如说身份证信息,开房的这种信息是不是就应该加密?就算别人把你的数据拷走了,他也破解不了身份证信息,那就不知道是谁开的房。
澎湃新闻:你在书中也提到,有一种倾向,就是把数据作为达到目的的一种工具,但是实际上它并不是根据数据得出结论的。现在这种倾向还存在吗?
涂子沛:很多人用数据就是对自己有利的时候就用,无利的时候就不用。对数据有一种“夜壶文化”,想要了就拿来,不要了就把它拿走。但我认为这不对,应该把数据当作水,水不应该有任何的杂质,应该是纯净的水,数据要像水一样纯净。我们每个人每天都需要,因为数据它是事实,它代表逻辑、代表精确,数据是事实,是神圣不可侵犯的、是不可修改的、是实事求是的,如果我们把事实改变了,我们做出的决策可能就是错误的。我们一切都是在事实的基础上去延伸的话,这就是理性精神、科学精神,数据就是事实的一个载体。所以我们说数据是水,你每天都要喝,才能保持你理性的思考,科学的精神,而不是凭感觉。
人的感觉是非常粗放的,但问题是我们不知道自己的感觉粗放,我认为自己的感觉还挺准的,人的一个最大的问题就是不认识自己。所以我书里面为什么要强调“数商”,如果一个人的“数商”强大,数据就能成为它一个新的感官,这个感官会战胜其他的感官。“数商”高就是数据要代替你其他的感官,代替你的触觉、味觉、嗅觉,用数据来思考。数据成为新的感官,那就是一个理性的人,而不是一个动物。
澎湃新闻:你在书中也讲到了中国的文化传统不是很注重精确和量化,总讲“差不多”。现在在大数据的时代,从技术上讲其实中国并不落后,但是文化上我们如何要与现在的技术做出适应和匹配?
涂子沛:我们中国不仅是“差不多”,我们是没有科学传统的,科学是在西方起源的。我为什么没有科学传统,因为我们不会量化。我们有几千年的天文记录,但是我们从来没算过,没算过星星是怎么样子的,也没算过星星的轨道,所以别人都在争论地球是宇宙中心还是太阳是宇宙中心的时候,中国人根本想都没想过这个问题,一句话就概括了整个天文学,就是“天圆地方”,没有更多的了。哥白尼他们已经算出了星体是怎么转的,但我们没有,就是因为我们没有量化的文化、历史、价值观,我们就用文字记。所以我说中国人是“文商”高,“数商”低。
今天怎么在大数据的时代把中国人的“数商”补上去,要做“文商”高,“数商”也高的人,这就是我现在在做的工作,我就是要把大数据从一个科技的符号变成一个文化的符号。要让中国人的DNA里面、思考思维方法里面有数据的DNA、有数据的记忆,知道我要去看数据、使用数据、寻找数据、记录数据、把事实变成数据。我希望有更多的人来读些书,学会利用数据能给他们赋能,我也希望有更多的记者媒体来关注“数商”这个问题。
《数商》书封。