【▲可扫码回看直播】
《唐宁会客厅》
上周四,AI行业先锋—百姓网创始人、CEO 王建硕;国内顶级AI医疗投资人—夏尔巴投资创始管理合伙人 蔡大庆;软件数据库、AI领域最佳投手—华创资本合伙人 谢佳,三位嘉宾做客《bet365体育投注》,与宜信公司创始人、CEO唐宁一起,分享了对ChatGPT为代表的AI的深刻理解;目前新的AI技术应用在哪些领域?新的AI技术浪潮带来的投资机会?企传投如何布局准备?
以下是一些有趣的观点:
- ChatGPT的核心是大语言模型,懂人话。它对用户来说,就像一个浏览器。说明现在大跨度走到了自然语言的人机交互界面,这对人类社会的方方面面及人与计算机的交互有深远影响。
- 现在的人工智能还在模仿式和思考式之间的阶段。
- AI制药领域已经出现了一些类似ChatGPT的技术。
- 越容易被ChatGPT替代的行业,未来从业的人越多,工资水平增长越多。因为被ChatGPT替代,说明生产力水平在急速翻番,门槛在越来越低。但要学习、提升和改变。失业和就业会同时发生。
- 当计算机可以做的工作,应快速把它从教育里剔除。现在最需要教的是提示词工程,每个人都应该学习怎么跟计算机对话。
- ChatGPT会给医疗服务、药、器械诊断等领域,带来如海啸一般深刻久远的影响。
O1
ChatGPT把用户带到了自然语言用户界面
唐宁:首先请建硕跟大家分享你对ChatGPT的理解,它到底是什么,以及有它没它有什么不同?它正在或者即将给各行各业带来什么?
王建硕:我认为ChatGPT的核心,就是大语言模型,等于AI现在懂人话了,这是ChatGPT带来的最大的一个变化。
很多人看到ChatGPT有聊天的功能,有人把它当搜索引擎用,有人让它帮写文章等等,但这些都是应用形式,就像用浏览器可以访问各种各样的网站。对用户来说,ChatGPT更像是一个浏览器,把用户带到了自然语言用户界面。
以前人机的所有交互,都是以图形用户界面(GUI)为主,这么多年以来,即便到了智能手机时代,用户都是通过点击、拖拽,或与屏幕上的可视化数据进行交互。
现在终于大跨步地走到了自然语言的用户界面,是从图形用户界面出现四十年以来的一次大的迁徙。人和计算机交互方式的变化对整个社会的方方面面,都是一件很重要的大事。
唐宁:之前也有类似机器人客服,接客户电话做得还不错,以及有一些电话也是机器人打的,也有一定的效果。包括远程指挥家里或者办公室的电器等等,也是有某种语音操作的逻辑。那么ChatGPT给我们带来了什么,以及是不是还有其他的类似应用?
王建硕:其实最大的差别,是以前的自然语言处理背后的技术都是一个特定的小模型。比如有的就是控制家电的,有的就是回答知识的,每一个小模型都做得不错,但是要把小模型组织起来就很难。比如问银行机器人客服,说我要查我的银行账户,这个机器人通过背后的小模型技术支持可以进入到银行账户的查询里面,如果这个时候你忽然问它一句李白是哪年出生的,它就晕了。它需要一步一步地回到根上面去,因为它是不同的模型拼接出来的。
但是OpenAI用了一种大力出奇迹的方式,它的AI模型不是之前的那种小模型,而是把所有自然语言处理的问题都扔到一个模型里面,投喂了45T的数据,然后再加上了无数的算力,最终打造了一个大型的1750亿参数的模型。
这个模型大到包罗万象,这么大之后,你就忽然觉得这个机器人变真了,让它帮你查账户它就查账户,你跟它聊李白它就跟你聊李白,你跟它聊经济它也跟你聊经济,总之聊什么都可以。这种大模型创新是以前没有过的。
人和机器聊天以前有那么多的应用,但都觉得差得挺远的,你不能把它真正当成一个人,再好的客服系统,你要把它当一个真人的话,鼻子都会气歪,它不会跟你聊情感、跟你做诗、聊家庭的烦恼之类的。但是忽然一下子,通过通用大模型这些都成为现实,让人一下子觉得它活了。这中间其实是一个巨大的坎儿,差异很大,我们都有这种感知,这个坎儿要是没跨过去就没跨过去,一旦跨过去以后,所有人都觉得对了,这个点已经过了。
唐宁:是不是就像我们让AI机器读了天下所有的书,这个书里边举例来讲,可能在说季节的时候都是说春天之后是夏天,夏天之后再是秋天。于是,当AI机器人从书中学了这些之后,当你跟它谈论季节的时候,你谈到春天,它会知道下边大比例的都会是该说夏天了,于是你再接着问,它会说夏天,这就特别像人。这是理解这个原理的好的框架吗?
王建硕:没错,就是这个框架。ChatGPT的G是Generative,P是Pre-trained,T是Transformer,它的核心就是顺口溜。可以这么来理解,比如我说床前明月,然后加一个空格,人们脑子里面就都会有个光字。它并不是你思考了到底是光字儿,还是什么字儿,而是当你看了很多的文章以后,基本上说到床前明月,然后那个字儿就溜出来了。其实ChatGPT,或者大多数的最近的自然语言领域,都是这样一种原理,找到词和词、字和字,或者段落和段落之间关系。
甚至如果你去问它数学,333乘以127,然后它给出一个结果是错的,但是最后一位数一定是1,这是对的,为什么呢?因为它知道以3结尾的数字与以7结尾的数字相乘,最终以1结尾的数字是押韵的,它是用押韵的方式来算出了数字,而不是它懂数学。
唐宁:“押韵”就是说它看了很多?
王建硕:押韵就是你看的多了。床前明月光,光跟亮等等意思差不多,但是听多了床前明月光,就知道最后一个字就是光,这叫押韵。
02
现在的生成式AI能力介于模仿和思考之间
唐宁:能不能举个例子,你感受到的AI也好,ChatGPT也好,对于既有模式的巨大冲击,或者说有什么可预期的变化?
王建硕:除了ChatGPT写文章,对我来说让我觉得惊喜的一个时刻,是比如说会把文字按照给它的要求变成比如说代码,这对我们这种编程的人就极为重要。
举个例子,以前可以实现的是,你对机器说——用男人的形象来生成早上好这句话的视频。然后你给它一个例子——make a video“早上好”,male——它就学会了。然后这个时候,你再跟它说一句话,比如——用女性的形象跟我讲一讲晚上好,它就会用make a video“晚上好”,female。这种方式是以前已经可以做到的。
ChatGPT让我最惊讶的是,假如你告诉它——用maggie的形象来说早上好——它会把maggie跟女性对应上;跟它说——用小明的声音里讲早上好——它就会把小明跟男性对应上。也就是说,它对maggie和女性之间关系、小明跟男性之间的关系、苹果跟甜之间的关系等等的理解层次是非常深的,这一点我觉得对我们来说很好用。因为这个事情我们自己要做的话,也挺烦的,要写好多代码,而它帮你全搞定了,这就是自然语言处理领域达到了一个很高的高度了。
唐宁:谢佳在软件方面做了很多研究,听说现在使用ChatGPT辅助编程设计,它能给我提供80%以上的准确率,并且能力已经到了谷歌编码职位 L3 工程师(初级软件工程师)级别的能力了。这意味着什么?是不是ChatGPT生成软件到八九不离十的程度,人再看看就成了?同时意味着像中国的软件工程师红利,或者印度的软件工程师红利就不再了?甚至对你之前投的很多工具类的软件企业来讲会有什么样的影响?
谢佳:从我们的角度来看,确实OpenAI的ChatGPT为我们带来了通用人工智能(AGI)的元年。为什么说它是元年呢?因为它确实带来了我们叫定义式体验的突破。
虽然过去AI在很多领域都获得了不错的应用,但小模型只能解决某个细分领域的事,比如扫地,包括围绕扫地相关的事。
过去更多是分析统计式的信息技术应用。Generative的AI是生成式的AI,所以你用ChatGPT会得到很多意料之外的结果,往往是带来惊喜的。现在通用人工智能 (AGI) 确实是巨大的一个底层能力的飞跃。
对于软件领域我的一个观点是,我非常相信基于生成式AI大模型的这个基础能力,实际上我们已经进入到了下一代信息技术应用的新范式阶段。
这个阶段有两点是我们特别看重的:
一是来到新的人机交互时代,不同于图形用户交互界面,无论是获取知识,还是想要解决一个问题、处理一个任务,都是去点、去选、去下拉框里面去选。
今天新的交互方式是机器可以理解自然语言了,那所有的交互在这个时候有一个根本性的范式变迁。所以我们相信,未来很多会被颠覆的应用场景,主要在于需要机器很好地去理解人的意图,其实这就到了被颠覆的临界点。
范式迁移的第二个特征,就是我们真的来到了一个更以数据为中心、算法为中心的信息技术时代。过去我们都在讲各种大数据的应用,但实际上那个时候很难把数据价值发掘出来的。今天OpenAI手握ChatGPT和DALL·E2,ChatGPT基于底层的这个GPT3.5的大型语言生成模型,能生成文字,作诗,还可以理解人的意图写代码等;DALL-E2模型可以AI生成艺术家级别的图片。
那现在的AI能不能做到替代程序员80%的工作量呢?可能需要分场景。这个事情刚刚才开始,或许OpenAI的编程能力是达到了谷歌18万美金年薪的L3(初级软件工程师)水准,但实际上真的要完成一个应用程序全部制作过程是很复杂的。这个过程对于ChatGPT来说,可能刚刚才开始。
为什么生成式AI大模型突然就具备了一个跃迁的能力,也就是生成式AI和大模型的智能涌现能力?这里极有可能的一个原因是,在训练这个通用大模型的时候,不光给了他自然语言的文本,还把相当一部分逻辑严谨的代码喂给它。所以我相信在信息技术领域里面,机器能够自己生成代码这件事情,是非常底层的,会颠覆整个信息技术产业的一个事情。
唐宁:对,这个我觉得是量变到质变,就是看质变是不是会发生。我理解它是读了很多的诗,很多的小说,很多的代码,所以大概能够根据读过的代码去生成代码。所以还是一个模仿式而不是思考式的工作。不知道会不会到了一个时间点或者叫奇点,它就能够进行思考型的工作了?
谢佳:我理解现在ChatGPT的生成式AI能力介于模仿和思考之间。所谓模仿,就是还是统计的逻辑,大概读了这些代码,当你提到想要生成某一个类似代码的需求的时候,把它调出来,这是模仿式的。
另外一个就是思考式,可能现在还在过程中,就是当想要去解决一个问题,我用自然语言把它描述出来,生成式AI不是根据从库里提出来的模板,而是为了解决提出的问题,可以有逻辑、有思考地去生成代码。
举个例子,相信很多企业家都会为自己的企业部署商业智能软件,我们的有些被投企业已经做到了。
过去的商业智能应用,企业只能做到提前设定,包括需要采集哪些方面的数据,需要监控哪些业务指标等等,很难去处理预想之外的突发奇想的需求。但是这些需求往往其实是具备非常强的商业洞察,而且有很强的时效性,目前的做法是把这个需求提给商业分析部去做需求的转化,再提交给数据工程师来写SQL查询语句即SELECT检索语句,去检索数据库。
但通常这可能就需要T+1、T+2、T+3,甚至有的复杂的需求还要回过头来确认需求,往往这样一套流程走完时效性就没有了。而且也因为有这个门槛,也有成本,很多的想法就不能及时地得到数据的查验和对比。
有了ChatGPT这个自动生成代码的能力之后,可以做到比如企业的决策者或者管理者或者业务人员提出来的问题,能够通过ChatGPT自动生成。即时洞察就会立刻转化成一个具体的数据来验证,进而带来更多洞察。所以有了这样的能力的企业本质上就变成一个非常不一样的企业。
03
中国的ChatGPT水平达到什么程度了?
唐宁:国内什么时候能够有自己的ChatGPT?
王建硕:中国有ChatGPT是必然的。因为哥伦布已经发现了新大陆,第二次再去的难度骤降。当时这个行不行,大家不知道,投了很多美金啥都做不出来的时候还要不要再投?五亿美金还是投五十亿美金?没人知道。但现在我们知道它就算再贵,花了1200万美元能做得出来,那么中国其实是有这个财力的。
唐宁:就是说可以做出,但技术门槛是不是很高?
王建硕:业界基本上统一的认知是,它是一个没有秘密但是有很多窍门的东西,窍门是可以给出足够的时间是有可能蒙得出来的,但是它里面整个大的步骤其实非常清晰,就是要去试,拿钱去堆,然后最后把它算出来。
唐宁:现在中国的ChatGPT水平达到什么程度了?
王建硕:反正一年之内不要有特别高的预期,连谷歌都不见得能立刻做出来。但是长期来说我还是比较有信心的。就像十个月能孕育出一个孩子,但是三个月一定生不出,它是一个时间的问题积累的问题。
唐宁:最近很多上市公司以及相关各方都说自己在跟ChatGPT紧密结合,国内是不是已经有哪些机构或者哪些场景已经在应用了?
王建硕:应用应该有非常多了,因为应用门槛其实非常低,大家用ChatGPT根本不需要自己懂AI,也不需要懂。原来必须有AI工程师才能干很多的数据处理的事,而ChatGPT的P是Pre-trained,就是预训练,预训练好了以后,大多数的企业都可以在不直接用AI的情况下来使用自然语言,这个应用就如遍地开花所有人都可以用。
唐宁:你们公司是不是也在用起来了,用在什么地方?
王建硕:我们的模型也是百度“文心一言”首批的合作伙伴。我们其实混用了很多模型,但是对于用户来说,像客服、包括一些名人我们帮他做数字分身等等这些事情,其实已经有非常成熟的应用了。我们现在要干的就是结合比如企业的内容,帮助企业在本地做一个模型,然后就可以像ChatGPT一样来回答用户问题了。
唐宁:相当于比如我是某个行业的一家企业,把我们相关的信息给你,你就可以给我们一个应用,我企业的客户、用户,就可以了用自然语言交互的方式,去了解企业相关的业务情况。
王建硕:没错,比如一个服装企业,把他的所有客服信息,包括知识文档、知识库等等灌进去,你就问它与这个企业相关的所有的内容,它回答得非常完美,我们到现在测试的结果是,基本上百分之八九十的问题都得到完美回答。
蔡大庆:大的制药厂多年积累了那么多化学的数据、病人的数据等等,都是财富。现在还没有看到大家披露出来,但是一定马上有人夜以继日地在试。
ChatGPT一些通用原则在医疗上也是适用的。医疗的三大块——医疗服务、制药及各种新的治疗模式、诊断以及影像——ChatGPT是完全打开了一个新的世界,在这三大块都会带来海啸一样深刻久远的影响。
虽然现在大家说ChatGPT会一本正经地胡说八道,但是被用得多了以后,逐渐它的能力会越来越强。举一个例子,医疗服务领域的人机互动,给他一些问题,把病人详细的病历情况给它,它会给出诊断和治疗的路径,以及下面该做什么,已经有一些初步的应用。
大家知道IBM Watson 是认知计算系统的杰出代表,也是一个技术平台,花了很多钱做了很多努力,但是由于之前的AI技术还不是完全意义上的AI,所以IBM Watson 做的并不是成功,最后只能从那个努力上先抽了回来。
现在有了ChatGPT这种新的AI大模型技术,原来像IBM Watson那样的技术平台,输给它病人的数据最后出来是非常深刻的,结合了不同种的病人的治疗方案,加上大量的文献总结、人类对医学的理解,然后在这个基础上产生一些对病人的治疗有指导意义的东西。这样的时刻一定会到来。
但是这里面也有好多诸如伦理问题、要花很多的钱,数据开放等等步骤要走。不过现在医疗AI影像处理领域已经有上市公司了。
我再分享一个AI制药方面的例子。现在实际上AI制药这个技术已经包括了一些类似GPT的一些框架,能够极大地加速药物研发的进程。它有三方面很重要:第一,降低成本;第二,提高效率、缩短时间;第三,它能够发现以前人类单凭着自己的想,不一定能够想出来的全新的东西,比如新的蛋白质,新的结构等,这是很珍贵的。ChatGPT在这些方面未来会带来很可观甚至是非常深刻的一些变化。
用传统方式,就一个苗头化合物(对特定靶标或作用环节具有初步活性的化合物)发现,就需要一年时间,花接近一亿美元。现在用生产式AI的方式,虽然还是初级的,但已经能够把研发时间降到两个月左右,成本降到20万美元以下,大大加快了研发速度,降低了成本。
现在国内我们投的公司里面已经有企业达到这样的成果,临床前研发的周期缩短70%,研发效率提高5到10倍,研发成本降低了70%。这还是一个比较基础的方式,但未来我觉得更值得期待。
04
哪些新的投资机会我们值得关注?
唐宁:ChatGPT、AIGC会在今年以及未来一段时间带来哪些投资机会?过去也有了一度对于AI的热捧。后来又有一些跌落神坛等等,那么这次以ChatGPT为导火索的人工智能大风口,可以持续多久?有哪些新的投资机会我们值得关注?
谢佳:首先我认为这波机会不会像烟花一样一下就没了,它一定是一波接一波叠加的机会。核心的原因是因为这个AI技术在底层获得了本质性的突破,是生产效率来到了一个奇点。但实际上我们还不愿意把未来的投资框架过早地确定,局限地按照这个图谱去找,因为像GPT1做出来的时候大概是1亿级别的参数,GPT2大概就是10亿,到GPT3就达到千亿的水平。目前的ChatGPT可以简单地理解是基于GPT3.5模型做的一个应用。那GPT4,据说能力又会再上一个量级。所以未来生成式AI到底会具备什么样的能力,今天来做这个预测,就有点像早些年的时候有人问比尔盖茨,互联网是什么?它能做什么?那个时候可能也很难回答。但非常值得期待。
再往后来到移动互联网时代,智能手机每增加一个传感器,无论前置摄像头的,还是陀螺仪的等等,都能带来很多的应用创新和巨大的商业机会,更不用说把用户都互联到一个网络当中去而带来的2C和2B的机会。
所以今天抽象来看这个生成式AI可能会带来的机会,我们会有这么几个判断:
一是非常底层的大模型,它实际上是门槛非常非常高的一个事情,任何一个想要做应用的企业,无论是2C的还是2B的,无论是生成文本的还是生成图片,或者是数字人的,都不太可能从零开始自己做一个大模型。大模型是需要巨大的财力、对算力的获取能力、对数据获取能力,还有可持续吸引最顶尖人才的能力,这实际上是非常稀缺的一个事情。
在底层基础模型之上的纯应用,比如说生成一段可用于做市场营销的文案,这个过去是很考验人的一个事情,得花不少时间,有的还得去买版权,现在生成式AI可以来生成。把关键词告诉它,生成的东西还挺相关的。
这种AI生成和过去不太一样,它不是从模板里匹配一个,而是根据你的需求,高相关性的生成一个,甚至会带来很多惊喜。这些应用都是需要去调用底层模型,我认为其中一段机会很有可能就存在于底层的基础模型和应用之间,更好地把独有的领域知识和大模型能力结合起来的这么一套工具。这样的中间层工具或者信息技术,在现在所有的技术当中都还找不到现成的,这就是新的计算机范式带来的新机会。
唐宁:也就是说行业或者企业,想用ChatGPT,还不是立马就能用的,因为它是一个通用的,而不是特有的针对某个行业或企业的,所以得找到那种中间的工具,把具体行业或企业的信息提供给它,然后它把与ChatGPT、AI的这样通用能力融合起来,帮助部署一系列的软硬件,就能够让我更好地插上AI的翅膀,所以有中间工具层这样的机会,当然也有各行各业的这样的机会。
谢佳:没错。这里的机会可以分2B和2C来看。2C的机会,我们看国内,很有可能BAT级别的大厂同样也回去做;2B的机会,普遍就是一个结合的关系了,过去你在某一个领域,有很多的客户场景,有很多的数据积累,你对这个领域很了解,那就看你怎么样把生成式AI的能力更好地用起来。所以这又回到中间层工具的这么一个定位。
唐宁:蔡博士请跟大家分享你们最近围绕AI,围绕ChatGPT在看哪些机会,或者在思考未来会有哪些细分领域,特别值得关注?
蔡大庆:实际上在药、器械影像和医疗服务这块,我们都看到了未来可能比较大的应用场景。但是就像其他领域的投资一样,国内甚至是国外都会有一批公司一拥而上,那什么样的公司在这里面能够真正跑出来?我们觉得那些在细分领域常年耕耘,有深刻洞察,并有数据积累,特别是积累的结构化数据多,这样的公司更有机会。
唐宁:以后可能像全科医生,是不是就是ChatGPT的某种形态了?不像现在国内看哪科就挂哪科。还有类似中间层的工具先判断判断,然后推荐专家。但是如果真正像你说的场景够实现的话,那这真的专业性得足够强。
蔡大庆:是的。原来是哪儿不舒服了,先百度一下应该看哪科。在未来可能会出一些新的工具变成大夫的有利帮手。甚至像家庭医生、全科医生,针对早期的一些问询能够更加低成本、高效率地来完成,这是非常有可能的。当然了,这里面还有诸如伦理、监管等问题。
唐宁:最近有好几家我们投资企业的创业者联系我,说他们在琢磨怎样能够插上ChatGPT这类新的生成式AI的翅膀,能够帮助他们实现飞跃。举个例子,我们投了一家特别棒的主要针对青少年群体以及年龄更大一些的人群,提供心理按摩抚慰这样的心理咨询服务的轻应用。最早这样的活都是线下干的,在一个非常温馨的环境之中,但对于参与者来说也是有压力的,而且成本相对高。
王建硕:我这边可能要稍微给大家泼泼凉水,降降温。ChatGPT在语言模型上面有个巨大的突破,开启了人机自然对话的新世界。但是在整个人工智能领域,我们最近并没有看到因此有大的突破。比如人工问诊,就是所有的专家系统都已经完备的情况下由AI来做翻译官,这件事情是立刻可以使用,并且在今年会到处开花的一种应用。
但除此以外的比如自动问诊、自动医药筛选等等,并没有看到突破。所以往更智能的方向走的话,可能还会有三到五年,甚至更长时间,就看那个领域有没有一些像大模型这种人工智能的突破了。
我们最近在看ChatGPT的时候,一定要小心,不能把它泛化成人工智能的突破,我们只是看到了一个自然语言模型,需要更冷静来看它未来的发展。
唐宁:这个你同意吗,谢佳,我似乎从你刚才的分享之中,听到了比这个更多一些的东西?
谢佳:我总体上是同意的。引用过去人工智能领域极为权威的一个学者、目前也是Facebook的AI首席科学家,他就有几个观点:
一个观点是基于现在的大语言模型,ChatGPT不能区分什么是事实,什么是生造出来的信息,所以大家会有这种体验,ChatGPT有时在一本正经地胡说八道,还能自圆其说。
第二个观点是所有的机器学来的知识,其实还只是人类智慧和知识比较肤浅的一些部分。所以,在语言理解方面它是一个巨大的突破,大模型的应用在跟写作、编程相关的领域是非常适合的,但如果把它当成通用人工智能的终极形态,那肯定还没有到那个状态。
蔡大庆:我再补充一两句,AI在比如医疗问诊里的应用实际上还是非常基础的,现在好多也都是由不同的大夫,学习各种病理文献,然后根据病人的情况给出治疗建议。现在的大模型技术对于学习浩瀚文献是有很大帮助的。当然刚才建硕总说的我是非常同意的,现在人工智能在医疗领域的应用还远远没有到那一步,尤其AI永远取代不了大夫对病人的接触和关怀。
唐宁:我觉得对于AI,对于ChatGPT,可能不必高估它在未来两个月的作用,但是也一定不要低估它在未来两年、二十年起到的作用。
另外,也特别希望现在人工智能这个引领潮流的新进展,切实在帮助企业数字化能力建设提升上再推一把,这是非常重要的。就像刚才列举的在线心理服务企业的例子,最终服务还是要活人大比例的去提供,但人可以借助人工智能工具提升得更快,企业在数字化水平方面更上一层楼。如果现在的ChatGPT,可以让企业家和管理者对数字化这个事有更强的动力,是不是也是一个很好的作用?
王建硕:数字化是在过去二十年到三十年,一直在做的事情,这个进程不会因为ChatGPT的出现与否有任何变化。而ChatGPT真正要做的不是数字化,而是用自然语言跟计算机系统交互。
比如,我预测在未来的十年里面,中国会新增五亿到八亿左右的程序员,就是我们这些普通人,等于说中国的1/3到2/3的人,都将变成用自然语言编程和机器打交道,这将会对世界产生变革作用。原因是原来的英语教育和计算机教育都是世界听不懂中文,所以我们要学英语、学计算机。而现在计算机往前走了一大步,它能听得懂我们的自然语言了,那么我们就可以不用学英语、学计算机了,但是我们还要学一种新型的和机器打交道的语言,就是提示词工程。
以前我们与计算机交互是需要先设置它的背景、主题,并且加上一些限定词,来让它最后输出的东西是你要的。当把这些全写完了以后,已经是一个四十行左右的程序了。现在唯一的区别,就是拿自然语言来写程序,引导AI得出答案,形成正确的回复。而这件事情对于我们每个人来说,都是需要学习的,这个挑战其实蛮大的。
唐宁:是不是还是要去区分一下ChatGPT跟AI,AI是一个大得很多的范畴,ChatGPT是一种语意识别AI应用。
王建硕:我的看法不太一样,整个AI领域目前只有自然语言处理模型这一条线上面产生了巨大的进化和提升,形成了巨大的科技变量,它的变革作用远远大于整个AI。
唐宁:也有人问,国内各个平台数据不共享,ChatGPT能实现吗?
王建硕:这是两个问题。投喂给ChatGPT的数据,来源于应用的创作者,而不是来自于OpenAI或其他人,没给它数据,ChatGPT当然一本正经胡说八道,它是个语言模型,本身也没有任何数据。最终还是要解决数据问题,这不是ChatGPT的问题。
假设一个小公司只有一百份文档,也可以用ChatGPT创造一个应用,只要问的问题在这一百份文档里面,就可以完美回答。超出这一百个文档的问题,就告诉你不知道。这就是我们现在应该去建的一个应用。
唐宁:对提问的人的要求就比较高了。
王建硕:不需要,比如我告诉这三十样东西的价格,把它输进去,然后你就问我三十个产品的价格,它都可以非常自然地回答。可以各种方式、各种语言,只要问这三十种产品的价格,都可以告诉你。
唐宁:这个场景它的底层是不是仍旧是一个超大型的模型支持,不可能只是那几页纸支持?
王建硕:要做出这个ChatGPT,需要一个巨大量的数据量进行训练。但对于ChatGPT大模型上的应用者来说,只要有一张A4纸,就可以做出一个非常好的东西。
唐宁:这个应用就是刚才谢佳讲的行业层面、企业层面垂直的应用,但是下边有一个通用的大模型,所以是水平通用的再加上某个垂直的合作,最终生成了建硕刚才说的那样的一个体验。
王建硕:这个再稍微补充一下,它其实不需要那么大量的数据,ChatGPT的底层模型就45T的数据,这个比起互联网数据来说,几乎是百万分之一的量。而且这个数据一定要选行业里面最好的,否则一旦扩数据量扩大了以后,反而没法用了。
05
越易被ChatGPT替代行业,
未来从业的人越多,工资增长越多
唐宁:据说很多大学已经不允许学生用ChatGPT了,否则同学们会用它做作业,写论文。另外也有说法就是有了ChatGPT之后,教育特别是像中国的应试教育育人模式也受到了巨大的挑战。再加上它对各行各业可能的替代作用,那么在育人、培训年轻一代上,如何应对挑战、捕捉机遇?
王建硕:对于技术爱好者来说,应该有个共识,所有不允许使用新技术的学校,都是愚蠢的。这只是他没有办法去应对这样的一个变化时的应激反应,先不允许用再说。但是这也能理解,我相信要不了多久大家都会改正这个错误,重新让大家再去用的。因为科技的发展肯定是一件好事,不可能永远抵抗科技的进步,但适应它需要一些时间。
唐宁:但是对于学生的作业,能分辨到底是独立完成的还是用工具去生成的吗,这会不会影响学习质量?
王建硕:如果一个东西机器可以做,就不应该交给人去做,应该迅速把它从教育里剔除出去。教育是不断往前教更有用的东西,然后把机器已经搞定的事情从教育里剔除的过程。比如现在已经不教人怎么种地了,五谷也不用分了,古代私塾里的东西都不教了,原因是这些已经被技术给替代了。然后不断地要去教一些更高水平、更高抽象度的这东西。就跟那个工人砸蒸汽机,纽约码头工人会罢工来抗议集装箱等等,这样的事情在人类社会是必然会发生的,但它无法阻碍整个科技的发展。
唐宁:展望一下,你觉得以后会教什么呢?
王建硕:最主要要教的就是提示词工程,这可能是未来五年左右最大的一个挑战。无论老少都需要从头学习怎么跟计算机对话,怎么用新的方式使用计算机。
蔡大庆:那接着一个问题就是,怎么解决有的学生有相关的学习途径,有的比较缺乏,这怎么办?
王建硕:当AI变得越便宜,就越平权。当一个技术越发展,生产力越高,它的成本就越低,只有到成本越低的时候,才会做到越平权。而通过提高成本,使有能力去访问的人变得不能访问的方式,历史上已经做过太多次,然后都惨败了,我们不需要再做一次了。
唐宁:什么是不可替代的,什么是不可被人工智能所替代的?
谢佳:生成式人工智能的发展,使得比如程序员被替代了,创意写得不太好的人也有可能会有危机感,那么人的艺术性和原创性的价值被放大了,这是机器没法替代的。包括对于程序员来说,知道要去解决什么问题,并且把问题合理拆解,这个可能也是机器在短时间内还做不到的。
唐宁:你那几个关键词,我觉得都特别重要,一是艺术性、原创性,这些都是很多中国孩子很缺乏的。我们过去学数理化,但那其实跟编码类似,可能挺容易就被取代。另一个刚才说的关键词,就是提出问题的能力,过去我们都是老师提问,学生回答,而且都有标准答案等等,但是以后提出问题的能力、找出需要解决的问题的能力,是特别宝贵的。
王建硕:我们人类的目标,或者理想社会,就是所有的东西都被机器替代。我们为什么一定要不被机器替代呢?否则我们所有人都还得去扛麻包。
唐宁:那一天到来的时候,跟大家分享一下你在做些什么,分享一下王建硕老师的24小时。
王建硕:我们不用看未来,只要看今天,现在每天做的事情就是行为艺术,这就是我们被机器替代的结果。从一百年前的祖先来看,全球97%的人必须是农业人口,每天需要去劳动,因为当时的技术水平不足以支撑任何人不在地上干活。现在如果以他们来看,早上起来,然后跟人去喝了杯咖啡,晚上居然又跟几个好朋友隔着屏幕说话,然后就过了这一天,而且我能吃饱肚子,天哪,你是行为艺术啊。
蔡大庆:在达到建硕总说的那个美好理想之前,可能还有一二十年,甚至二三十年,人需要去做些什么,需要跟物质直接交互,这个状态可能还要存在一段时间。
就像做手术,虽然现在有打分器,但它还是要有一个人来指挥。再过比如一二十年,病人上去,根据诊断,机器自动就把该干什么的做完了,这也是有可能的。但是在到那个阶段之前,可能还是有一段的时间吧。
王建硕:刚才我们在说失业这件事情,说程序员等会被替代,大家有没有发现一个现象,越容易被ChatGPT替代的行业,这个行业未来的从业人员会越多。而越不容易被ChatGPT替代的行业,这个行业将会萎缩,并且最终所有人都会失业。为什么这么讲呢?
过去四十年以来,每隔两三周,程序员的效率就会翻番,这件事情是日常。但大家有没有发现,在过去的二十年里面,中国程序员从十万人已经现在涨到了一千万人了。所以如果ChatGPT继续替代程序员的工作,程序员的总人口可能将会从现在一千万,涨到五千万,三个亿、五个亿往上涨。
而且,越是被ChatGPT替代的行业,工资水平的增长速度就越高。原因是什么?因为一个行业被ChatGPT替代,说明它的生产力发展水平在急速地翻番。
而比如说农民,就没有被替代。那么会发生什么呢?程序员的平均工资,相对农民来说,每一年都在涨,这样的话,使得农民会离开农田去当程序员。所以,我的基本看法就是,如果你的工作不能被ChatGPT替代,应该离开这个行业,去加入比如像程序员、绘画等等这些容易被ChatGPT替代的,然后使得你的工资可以大幅地上升。
唐宁:得学新东西。对于很多已经有一定年龄的人可能不是容易的事,这需要是非常开放思维,非常善于捕捉新生事物,愿意学习的人。
王建硕:我认为在一个领域,当科技的生产力水平在上升的话,行业的门槛就越来越低。低到比如说以前洗衣服,手洗总是洗不干净,但是现在的洗衣工已经变成了按一个按纽就可以把几吨的衣服洗干净了。所以我希望大家尽力拥抱ChatGPT,千万不用担心失业等等这些事情。
而且还一个很重要的,你会发现你不会失业的,因为其实变革都是因为有一个地方产生了极高的工资把你吸引过去,失业和就业两件事情同时发生的。跳槽的过程,其实就是失业的过程,只不过这叫无痛失业。
唐宁:你这些观点来讲,对于我们还是挺有激励的,大家别担心。
王建硕:放心未来很美好,不会有问题的。
唐宁:但是要学习,要提升,要改变,我觉得如果是积极的心态拥抱它,那一定是有好结果的。如果是被动的,甚至说是晃不醒的,就比较难了。
唐宁:咱们今天在讨论如何认识和捕捉AI、ChatGPT的机遇,大家注意到,我们在讨论之中,有很多的共识,也还有一些不同的认识,同时还有一些未解之题,所以需要我们拥抱未知,需要我们在科技大潮、变革浪潮来的时候,保持空杯心态,不断地去学习,不断地去问好问题,我觉得这个特别特别重要。今年《bet365体育投注》,以及今后都会持续给大家呈现这种如何去看待变化、如何去抓住机遇。最后请一句话总结一下,给大家一些建议。
王建硕:我觉得整体来说,ChatGPT所带来的应用价值,以及人机交互界面的跨越,是让人非常兴奋的一件事情,它将产生一个类似于互联网一样的长远的发展。我觉得我们应该保持乐观,然后迅速地拥抱新的技术。
包括我们现在也做了非常多的帮助企业,把它的内容直接用ChatGPT的方式给他的用户呈现,我觉得这件事情很快会席卷整个全国或者全世界。整体来说的话,我能看到一个比现在美好得多的一个未来,我是非常乐观的。
谢佳:我给年轻人的建议,是多去体验和使用生成式AI的各种应用,这样你可以更好地感受到下一代的信息技术世界应该会是一个什么样子的。
对于企业家来说的一个建议,就是现在生成式AI的能力雏形已经非常地明显了,而且它能帮助企业在数字化领域的进步我认为也是非常明确的,所以就需要做好两方面:一是数据价值如何挖掘,应该把这个事情从企业家一把手的角度去做更积极的思考;二是数据本身的保护,这是最为关键、最为重要的。对领域的洞察其实就藏在数据里面,而且企业的小数据它是准确的、是闭环的,这个数据是非常宝贵的,数据的保护需要做好。
蔡大庆:积极地拥抱这一个技术的大的浪潮,而且关注里的一些可能出现的一些问题。这里既有机会,又有比较大的挑战,但是机会远远大于挑战。
扫码解锁
精彩分享