人工智能(AI)在以大模型为核心实现着更加快速的发展,并正在向一个新时代全速前进。“大模型在改变人工智能的同时,也在改变着全世界”似乎在一夜之间成为科技界公认的客观事实。大模型时代的到来使得人工智能AI迈入了一个新的发展阶段,在这个阶段,专业性大模型的开发和应用成为了行业关注的焦点。本次1024程序员节城市聚会重庆站,邀请了来自前沿领域的行业专家,分享最新应用与案例,引领智能革命,这场不容错过的AI技术盛宴,带领行业精英共赴未来之约。

10月21日,2023年中国1024程序员节城市站系列活动·重庆站圆满举行,本次城市聚会活动邀请了马上消费金融资深AI工程师李国冬,探寻LLM生态前沿技术,行业大咖抛砖引玉,参会者们共同交流探讨,碰撞思维的火花。

 

AI的发展趋势

 

李国冬老师从四个时间节点出发,为大家梳理了人工智能的发展历程。从1950年代人工智能这个概念被提出,到1980年,机器学习开始越来越受欢迎,再到了2010年,深度学习在弱人工智能系统方面有了重大的进展,最后在2020年之后,我们迎来了大模型。

紧接着,参会者们与李国冬老师就国内外公司的大模型布局展开了探讨。国外公司的大模型布局以微软为典型代表,而国内公司也在这个领域大有作为。其中,文心大模型、混元大模型、通义大模型和盘古大模型都是国内公司在大模型领域的代表。这些大模型涵盖了自然语言处理、图像识别、语音识别等多个领域,可以为各行业提供更加智能化的解决方案。这些大模型的出现,意味着国内公司在人工智能领域的实力逐渐崛起,未来将会为国内的科技发展带来更多的可能性和机遇。

 

LLM 能做什么

 

大模型概述

 

李国冬老师继续向参会者们介绍了大模型和大模型全栈技术。大模型(Foundation Model),又称为基石模型,模型通过亿级的语料或者图像进行知识抽取和学习进而生成了亿级参数的大模型。其实就是自监督学习,利用大量无标签很便宜的数据去做模型预训练。

这种预训练的方式可以使得模型更好地理解语言和图像,从而在下游任务中取得更好的效果。大模型可以应用于多个领域,如自然语言处理、计算机视觉等。此外,大模型的训练需要大量的计算资源和时间,因此只有一些大型科技公司和机构才能够承担这样的训练任务。但是随着技术的不断发展,未来可能会有更多的机构和公司能够开展大模型的训练和应用。

 

典型的通用大模型

 

大模型面临的挑战

 

李国冬从训练、评估、推理三个方面介绍了大模型所面临的挑战。大模型训练所面临的问题在于其分布式训练需要综合考虑算法、数据、AI框架、资源调度等技术全流程和全栈的能力;在大模型评估方面,构建高质量评估集是一个巨大的挑战,因为需要平衡难度和场景多样性。评估样本过于困难会导致所有模型表现不佳,而评估样本过于简单则会失去比较价值。传统NLP任务的评估方法难以完整刻画和客观衡量大模型的能力,因此需要构建全面客观的评估体系,以协助应用者了解LLM在不同场景下的适应性和局限性,同时帮助研发者发现问题并找到优化方向,从而提升模型的使用价值。在大模型推理方面,高效的推理是实现大模型产业应用落地的关键。

 

 

AI从业人员如何吃下大模型这一桌满汉全席?

 

在讨论与交流环节,参会者们围绕着“是否需要自建大模型”“如何对大模型进行有效评估”等问题展开了热烈的讨论,大家积极发表各自的观点和看法,从不同角度出发,探讨了自建大模型的可行性和优劣势,并提出了各自的建议和实践方法,为相关领域的发展提供了有益的思路和参考。大家一起总结有效的方法和实践经验,以更好地应对大模型的挑战,为AI从业者们的工作提供了有力的支持。这也正恰好回答了李国冬老师提出的“AI从业人员如何吃下大模型这一桌满汉全席?”这一生动形象的问题。

 

 

 

在科技大潮波澜壮阔的今天,人工智能成为感知、理解世界的技术底座,其场景应用已经遍地开花。随着生成式人工智能席卷千行百业,互联网圈催生了如火如荼的“百模大战”。可以看到的是,大模型已经从“拼参数”逐步进入到“拼应用”“拼落地”的关键阶段。这可能是一个全新的起点,以大模型为核心的人工智能新时代即将席卷人类未来的工作、生活。

 

后续,CSDN将携手众多行业精英持续开展更多行业的技术实践研讨会,助力企业破解发展难题。如果你对CMeet系列技术生态沙龙感兴趣,欢迎关注CSDN活动资讯,第一时间获取相关活动信息,并报名参与!

 

Logo

长江两岸老火锅,共聚山城开发者!We Want You!

更多推荐