21e2e9af5a3baca6ff4d9679037f7039.gif

整理 | 禾木木     责编 | 梦依丹

出品 | CSDN(ID:CSDNnews)

5 天注册用户超 100 万,60 天用户破亿,引得国内外大厂纷纷追随 AIGC 步伐,史上增速最快的消费级应用程序 ChatGPT 更是引领 AI 在科技圈一路“狂飙”。

2 月 8 日,在谷歌宣布实验性 AI 服务 Bard 后,微软就正式推出由 ChatGPT 支持的最新版本 Bing(必应)搜索引擎和 Edge 浏览器。除此之外,百度在 2 月 7 日官宣推出类 ChatGPT 应用、自然语言处理大模型新项目“文心一言”(ERNIE Bot),并于三月完成内测,面向公众开放。如果说 AlphaGo 当年跟李世石的人机大战是一场技术秀,那 ChatGPT 就像一把火点燃了沉寂许久的 AI 行业。在这场新的竞赛中,谁都不甘示弱。

e65e3220f37dede657b709ab584972ab.jpeg

对于 ChatGPT 热度的久居不下,CSDN 最新组织了一期《开谈:ChatGPT 新时代》访谈,并诚邀到了 AI 各个领域的高级专家,与我们共同探讨,他们分别是:

  • 中国最早研究 ChatBot 的硅谷知名孵化器创业导师李卓桓,PreAngel 合伙人,其开源项目 wechaty 在 GitHub 上拥有上百万的用户;

  • 开源第一个中文 Stable Diffusion 模型的张家兴,IDEA 研究院讲席科学家,北京大学博士,清华大学和香港中文大学等大学兼职\实践教授。曾任微软亚洲研究院研究员、蚂蚁集团资深算法专家、360 数科首席科学家。在深度学习、自然语言处理、分布式系统等多个领域的顶级学术会议和期刊上发表几十篇论文

  • MoPaaS 创始人兼 CEO 鲁为民,先后获得清华大学学士和加州理工学院(CalTech)博士学位。先后在 NASA JPL、IBM 和硅谷初创公司从事不同的技术创新和领导工作。这些年,他带领 MoPaaS 团队构建了可扩展的 AI 工程平台解决方案,以帮助企业加速 AI 应用落地最后一公里的问题;

  • 人人词典 CEO 笪小强

  • CSDN 创始人&董事长、极客帮创投合伙人蒋涛。

在蒋涛的主持下,围绕 ChatGPT 主题展开高端对谈,信息量巨大:

  1. ChatGPT  标志人工智能进入 iPhone 时刻 ,AI Foundation 成为新一代“编程”平台,所有老软件都值得用 AI 重做,Mobile First 结束,进入 AI First 时代 ;

  2. OpenAI 来源于工程能力的淘金者精神和巨大足本投入(10 亿美金的算力,上万张 A100 卡训练,均价大概在 10 万元/张,需要 10 亿到 150 亿的入场费),现在每天一亿对话,ChatGPT 会不断进化,类似于当年 Google 在搜索方面领先,后续其他人难以追赶;

  3. ChatGPT 不是 NLP,而是新物种,能理解对话(这是 NLP 范畴),还能执行任务(txt2code,这是微软长期投资办公自动化和开发能力平民化的收益),带来生产力的巨大提升,这才是革命性突破;

  4. 语言即智慧,GPT 模型能力并不能解决所有问题,依然有很多限制,找到合适路径和应用场景是关键所在,如帮助直男约会对话的应用,搜索关键词投放优化等自动化工作,这才是 AI 新应用时代的开始,需要具备新能力的“程序员”来开辟。

搜索『CSDN』视频号或点击这里查看本场开谈直播回放,以下为对话精编:

bd216db72f989f7ea2f07cb08e69b62d.png

一年时间能“复刻” ChatGPT 吗?

蒋涛:各位对于 ChatGPT 有何看法,美国开发者对 ChatGPT 的讨论方向又有哪些?

李卓桓:首先,我在参加 NeurIPS 大会时,有四万名 PhD 参加,充分证明了 AI 技术的火爆。其次无论是学界、业界还是专门关注 Machine Learning 和自然语言的研究人员都开始疯狂讨论 ChatGPT。

有趣的是,大家对于 ChatGPT 出现的效果很吃惊,一线的 PhD 们也没有想到它的模型能力远远超出了大部分开发者的预期,功能程度也大大超出了预期范围,甚至超出了模型研究规划的预期。它的发布可以说是奠定了 AGI 元年的里程碑。

张家兴:作为一名真正的业内人士,ChatGPT 的很多功能甚是惊喜。但最让我意外的是 ChatGPT 在信息抽取任务上可以很快速抽取到相关任务。大多数人使用它的人是惊讶于它的回答、推理以及对于一个人工智能可以懂得这么多的内容。我认为这也是ChatGPT给我们的未来指明了一条正确的道路。

鲁为民:首先 ChatGPT 的功能强大确实让大家觉得这是一个奇迹。虽然在 Transformer 出来之后,大家就开始关注大语言模型这个事情,但是 ChatGPT 涌现出来的各种能力确实很让人惊艳。

其次还值得关注的是它为什么可以获得大家的认可。实际上它的结构并不是很复杂,但它形成了一种新的学习模式,它可以根据用户的提示来上下文学习回答问题,使用自然语言,这也更加符合用户的习惯。

最后就是 ChatGPT 模型的规模优势,模型达到了一定规模以后,它的性能和其它能力也随着模型的规模增加而加速增加,所以这些内容在未来都是值得进一步去探讨。

蒋涛:今年 AIGC 也很出圈,无论是在质量还是速度上都做了一个很大的提升。但总的来说这还是一个开始,我们也来讨论一下,一年内,国内外是否能做出同等量级的模型以及它的难度都有哪些?

李卓桓:我认为 OpenAI 相当于已经迈出了第一步,它是基于 Google 最早的 Transformer 的模型,模型的参数越来越大以及技术上的突破等,使得它的发展也越来越快,讨论的人也越来越多。

对于其他大厂来说还是很愿意投入精力和时间去研究,最近也有一些很火的讨论,将这些模型称为 Model Foundation,比如说 OpenAI 提供相关的解决方案,我们只需要去找各种各样的 Model,这样就可以提供各种各样的解决方案。

AGI 领域被打开之后,接下来 AI 的水平也会急剧飞升。随着国内外大厂在这个领域的研究越来越多,并结合着 OpenAI 的解决方案,我相信在一年以内都会达到一个类似的水平。

张家兴:我的判断是一年之内应该没有团队能做出超越当时的 ChatGPT,或许可以实现 ChatGPT 当下的水平。这项技术要分几个要素去看,第一点是算力问题,虽然有很多公司表示自己已经有几千张 A100 卡,但这些 A100 卡并不一定适合做大规模并行训练,以及在算力规模上还有一些额外的成本和巨大的投入。

第二点是数据逻辑,在数据方面,OpenAI 是有相对的先发优势,它可以保持每个月月活在1亿,并不是所有的公司都有这个数据体量,并且 ChatGPT 会不断进化,类似于当年 Google 在搜索的领先,后续追赶者很难,所以我认为这也是一种优势的存在。

第三点是 AI 的工程化,其实我们可以看到有很多工程化的典型代表,例如芯片、汽车、手机等,后来者在研究前者的技术和内容时也是通过逐渐的积累,从而达到进步。其次我是希望大家可以把模型当做产品来做,而不是把模型当做项目,这样就可以不断的迭代升级,无论是在时间上还是说人力上都可以不断的累积和分析从而完成这件事。

鲁为民:最近在和美国一些大厂的技术人员也有这方面的沟通,ChatGPT 这次还主要是工程上的成就,归到模型上来说就是需要在工程上不断地打磨优化,不断地让它更完美。

我是同意将这种比作为工匠精神、或者更是淘金者精神。有一些看似偶然的东西,但实际上是有很多必然的一些东西在里面。除此之外,就是通过工程的细节来适配有限能力的基础模型,针对不同的任务来打造相匹配的模型,例如它在回答问题时结合上下文的任务等。还有打造一个大模型,需要达到一定的规模,意外结果才会显现出来。它可以根据用户的提问习惯来回答,但实际上是既舒服又简单。但它的训练也是需要很多资源来完成,以及不断工程打磨和迭代, OpenAI 是具备这些特点。

ebab888894e1bb3ad266a05d2875f7e0.png

新时代的 iPhone 时刻

AI Foundation 成为新一代“编程”平台

蒋涛:我认为 ChatGPT 的火爆就像是迎来了新时代的 iPhone 时刻,在工艺、应用和理论创新都有突破性的进展。如果说真的是 iPhone 时刻,那作为一名 AI 使用者,能感受到有哪些惊艳的地方?

笪小强:我在应用 ChatGPT 之前,我是不相信通用人工智能的存在。在我的认知里面,我认为通用人工智能是需要有灵魂,它的智慧是靠灵魂给予。

但是 ChatGPT 给我一种是通过算法逐渐给出答案,所以他给我最大的一个世界观的改变,并不是灵魂级智慧,而是语言级智慧。例如在语言学上的反例,就是狼男孩的故事,男孩没有学语言,就没有智慧,所以我从这个角度思考发现,语言学其实是一个非常大的和进步,尤其是语言学在翻译这个领域来说,大家一直梦寐以求要找一个叫语言中间态的东西。

那对于机器翻译来说,它仅仅能停留在表层的意思,无法去理解深层的内容,但  ChatGPT 在翻译上面真的可以做到信、达、雅的程度。简而言之,我认为它是懂语言的智慧和魅力。

我在应用时也发现了一些 Bug,就是在数学方面, ChatGPT 的正确性还是有待验证,并不是它本身不会做数学题,而是因为它的数学能力是靠语文老师教的,这也是很有意思的一点。他可以解释鸡兔同笼,能够解释思路和这个概念,但是对于方程解出来还是不会算。

李卓桓:我特别同意 iPhone 时刻这个观点,因为在 ChatGPT 发布之前,无论是投资圈还是创业圈对人工智能解决问题的关注已经是逐渐冷却的过程。

像当年 iPhone 出现,大家说好用后,新的创新应用是需要开发者去 App Store 里开发后,用户才能够开始使用。而 ChatGPT 我觉得和当年比起来最大的一个区别是它跳过了中间开发者的环节,甚至是绝大部分的使用场景和体验,都是用户直接到 ChatGPT 界面里面,和机器人在聊天中发现了一些特别有用的问法和回复的方法。我想这也是语言的一个魅力之处,因为它是足够的简单,中间环节也足够的少。

之前我们也提到了工程能力,我认为这也是一个很大的趋势,可以清晰的看到 AI 模型每年都在提升,但是为什么用完后却没有那么多的评价和反馈,就是因为它的工程没有跟上。做一个模型并不是说像交作业那么简单,是需要持续迭代、到用户场景里。

在 ChatGPT 的这个过程中,这种工程能力它有一大半是直接让用户用自然语言去问。所以我想说从这个角度来讲, AI Foundation 是真正的是比当年的 iPhone 更快,迭代更快,用户的发展和发现新的功能会更快,进而可能的是用户去反推开发者。

对我来讲,随着它通过微软 Azure 提供了这种稳定的云服务,那么这种 AI Foundation 将会成为接下来开发者为用户创造新的这种自然语言 AI 应用的这种产品的最好的土壤。这也是我非常认同现在是 iPhone 时刻的这个观点。

张家兴:从应用角度我会相对客观冷静的去看待,比如说在很多方面我们都可以用专门的模型来做,有一个很大的好处是告诉开发者当这种能力有了之后,用户更愿意拿它来做什么,例如在 ChatGPT 上排名最靠前的使用是写代码和文章,显而易见的是大家可以根据 ChatGPT 模型或是 ChatGPT 的 API 做自己的产品。

其次需要注意的一点是个性化的问题,如果我们都用 ChatGPT 做底层,那以数字人为例调性都是相同的,不具备个性化,无法满足用户的心理需求。

鲁为民AI 的发展更像是一种阶梯性的发展,在跨越之前需要不断的积累和消化。在消化大模型方面我们要注意的是如何做个性化、场景化,如何针对垂直场景去做等。

  • 第一是规模,它也是一种矛盾的表现,要让这个模型有一定的能力,就需要一定的规模,但如何在企业中(有限规模)使用它?当然首先要想是否有合适的场景和需求;

  • 第二点是资源,一方面有足够的资金,另一方面也需要有训练大模型的域内数据。虽然使用通用数据训练出来的预训练模型也是可以的,但是还得需要考虑针对不同的企业适配;

  • 第三是数据的选择上,我们在选择数据做模型训练时也要注意数据的问题域漂移和时间节点漂移的问题;

  • 最后一点是价值对齐,对于企业来说,所需要解决的问题领域不同,它定义的价值目标也不同,需要进行价值对齐,这也是一个很重要的工作。

我认为对于企业或垂直应用来说,这些是每次AI 跳跃增长之后消化利用当今最新通用技术需要做到的一些方面。

而作为一名程序员来说,大家可能都想要去了解测试这样的模型,围绕它去应用和编写代码,那这其实也是一种新编程方式,是使用类似自然语言来编程,也是一方面的机会。

在国内我们目前可以看到也有一些大厂在蠢蠢欲动,那还是有很多东西是值得期待,这些也是需要做出生态,程序员也可以围绕这做不同的内容。

蒋涛:是的,我最近在微博上也看到了很多关于 ChatGPT 的段子,例如帮助直男约会等,既体现了工作努力,又懂生活情趣,包装后的个人简历真的很惊艳也很有意思。

蒋涛:面对 ChatGPT 和大模型中小企业应如何应对?

鲁为民:对于像 ChatGPT 这类的语言模型,它的能力是有目共睹。对于中小企业来说不一定大家需要从头开始训练,可以围绕这些大模型做一些工作,例如 OpenAI 开放了很多 API,企业就可以利用它的能力开展工作,既可以控制成本,也能相应大模型所提供的红利。希望国内的大模型在今后也能提供类似的服务和发展。

李卓桓:我觉得它在 To B 和 To C 市场里面的应用都会受到很大的限制,它的局限性在于它只能跟你泛泛的聊天;第二点是准确度无法保障,例如面对医疗、法律时,当前的语言模型是远远达不到深度的。所以这也是 OpenAI CEO 说为什么接下来 ChatGPT 会让大家失望。

8042442a3f8f32f2a1aa258bb74ceb9a.png

AI 新应用时代的开始,程序员该怎么做?

蒋涛:对于 ChatGPT 也就是 AI 新应用时代的开始,大家对程序员都有哪些建议呢?

笪小强:我们又面临着一个非常好的时代,就类似于 2000 年的 PC 互联网,2009 年的移动互联网,现在就是 iPhone 时刻的出现。我们要在这个基础上去做更好玩的应用,我觉得互联网可以改变社会,那 AI 互联网也可以改变我们整个社会,所以我认为还是有非常多的机会。

张家兴:技术的变化越来越快,已经不单单是一个新的语言和框架简单的出现,大家要拥抱新的技术范式、新的手段,我希望大家能够与时俱进,追求自己最有价值的东西。

鲁为民:首先要能够不断的学习与时俱进,实际上大模型也衍生一种新的基于类似于自然语言的编程方式,所以程序员的作用会越来越大,无论是在企业应用还是技术创新,还是需要程序员去完成,所以说一方面要不断学习,另一方面要对未来充满信心。

李卓桓:首先是在软件开发领域,随着人工智能的技术的火热,它会出现一种新的技术和新的编程方式,建议程序员们学习如何去做 AI 的程序,让自己开始知道下一代的编程或者这种技术程序是怎么工作。其次是我建议大家抓住  ChatBot 这个领域的一些应用的机会,预计未来也是一种很火的趋势。

蒋涛:非常感谢嘉宾们的分享,今天聊得内容很有趣也是让大家意犹未尽。每一个人都从不同的角度和维度来分享,一起探讨 AI 新应用时代的开始,企业和程序员们的未来发展。

短期内,ChatGPT 可以使开发人员能够更快地构建,而不是取代他们。长期内,人工智能将使非程序员的创造者能够使用自然语言指令进行零错误的开发,但仍然需要开发人员,无论是对于企业还是开发人员,都会面临挑战与难度。

搜索『CSDN』视频号亦或者点击『阅读原文』查看本场直播回放视频!

d3cf0c54b88b465d481b9412df1a4405.gif

Logo

学大模型,用大模型上飞桨星河社区!每天8点V100G算力免费领!免费领取ERNIE 4.0 100w Token >>>

更多推荐