logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

GRPO+LoRA:大模型训练极简方案!

✅****我是一粟,专注于智能驾驶大模型,持续分享LLM面试干货。✅****大模型1v1辅导,已帮助多名同学成功上岸offer捷报金三银四春招季,又有两位训练营同学斩获大模型offer!一个是40k某军实验室offer,另一个是第四范式~恭喜两位同学成功上岸!随着DeepSeek爆火,面试中也越来越高频出现,因此训练营也更新了DeepSeek系列技术的深入拆解。包括MLA、MTP、专家负载均衡、F

文章图片
#开发语言#java#云计算 +1
一文彻底搞懂深度学习:注意力机制(Attention Mechanism)

在深度学习中,注意力机制模仿了人类在处理信息时的选择性关注能力,允许模型在处理输入数据时动态地调整其注意力权重,从而突出重要信息并忽略不重要的信息。注意力机制通过计算查询向量(Query)、键向量(Key)之间的相似度来确定注意力权重,然后对值向量(Value)进行加权求和,得到最终的输出。

文章图片
#深度学习#人工智能#数据结构 +2
我现在是一名JAVA开发,有必要转型人工智能吗?

这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。截至目前大模型已经超过200个,在大模型纵横的时代,不仅大模型技术越来越卷,就连大模型相关的岗位和面试也开始越来越卷了。大模型的发展是当前人工智能时代科技进步的必然趋势,我们只有主动拥抱这种变化,紧跟数字化、智能化潮流,才能确保我们在激烈的竞争中立于不败之地。某猎头公司数据显示,3

文章图片
#java#人工智能#开发语言 +3
各大厂商,ai大模型布局分析

近年来,全球科技巨头和初创企业竞相投入AI大模型研发,形成了技术路径多样、应用场景丰富的竞争格局。:GPT-4(多模态)、GPT-4 Turbo(上下文扩展至128k tokens):支持文本、图像、语音交互,突破单一模态限制。:复杂数学问题解决率较GPT-3.5提升40%。:超300万开发者接入,催生超700款商业化应用。:通过ChatGPT Enterprise切入企业市场,与微软Azure深

文章图片
#人工智能#数据库#机器学习 +2
如今的大模型浪潮是否是一场泡沫?

大模型最大的泡沫就是企业中高层领导脑子里面的泡沫。记得当年刚出来后,有的三低人士就去考文言文,对对联,得出结论:大模型还不如百度靠谱。这些人由于自身认知低,无法提出有意义的问题,没有认识到ChatGPT带来的革命性意义,那就是“大模型是AI第一次可以表现得像个人”。

文章图片
#人工智能#java#深度学习
ChatGPT Prompt技术全攻略-进阶篇:深入Prompt工程技术_chatglm的prompt技术

通过本篇博文的深入探讨,我们学习了如何设计更精准、更具创造性的Prompt来引导ChatGPT。这些进阶技巧将帮助我们与AI进行更有效的沟通,并生成更高质量的内容。Prompt Engineering是一个不断发展的领域,我们需要不断学习、实践和创新,以保持与时俱进。期待看到大家如何应用这些技巧,并创造出令人兴奋的成果。请继续关注我的系列博文,深入掌握Prompt Engineering的各个方面

文章图片
#计算机视觉#人工智能#数据库 +1
如何系统的入门大模型?

本篇回答默认面向对大模型领域感兴趣的程序员。看一下围绕大模型的应用场景和人才需求:**:**基于提示词对大模型的使用,会问问题就行。**基于大模型的应用:**在大模型生态之上做业务层产品。AI主播、AINPC、AI小助手。。。之前是会调API就行。现在有了,连调用API都可以不用了,动动嘴就可以实现应用生成。:给大模型配个“资料袋”**——**大模型外挂/知识图谱。**AI Agent:**给大模

文章图片
#人工智能#架构#java +1
人工智能时代,前端如何抓住机会_前端怎么向ai方向发展_前端ai方向

自从 2022 年底 OpenAI 推出了 ChatGPT3.5 后,GPT 的活跃用户数快速突破一亿,打破了互联网应用发展的历史记录。ChatGPT是一种基于人工智能技术的聊天机器人,它可以理解人类的自然语言,模拟人类的语言和思维方式,与人类进行自然的对话。GPT 技术的发展,给社会带来了巨大的影响,各行各业都在讨论GPT影响和带来的机会。微软公司创始人比尔·盖茨在其博客文章《人工智能时代已经开

文章图片
#人工智能#前端#开发语言 +2
大致讲一下ChatGPT的原理,给小孩子解释什么是ChatGPT

这也是我为什么一直强调现在学习AI的重要性,因为你如果对它了解不深的话,AI的很多潜力很难挖掘出来,了解它的最好方式就是了解它的底层原理,GPT就是一个非常好的切入点,我非常建议每个人都能看看这份人工智能入门课程及学习资料,其中也涉及到GPT的底层原理和应用技巧,非常的实用。现在的ChatGPT,是一种叫多模态的大模型,它跟第一代不同的地方就在于它不仅可以接收和输出文字,也可以接收其他类型的输入,

文章图片
#人工智能#机器学习#计算机视觉 +3
GrewAgent:AI Agent性能对比:Deepseek为何脱颖而出?

在人工智能领域,AI Agent的性能表现至关重要,众多产品都在激烈竞争,而Deepseek在这场较量中脱颖而出,展现出了独特的优势。首先,Deepseek拥有强大的语言理解能力。它能够精准地解析复杂的文本内容,无论是专业领域的学术论文,还是日常交流中的模糊表达,都能准确把握其核心含义。这使得它在处理各种自然语言任务时游刃有余,为用户提供高效、准确的服务。在知识储备方面,Deepseek也毫不逊色

文章图片
#人工智能#spring boot#产品经理 +1
    共 451 条
  • 1
  • 2
  • 3
  • 46
  • 请选择