heaven522 个人主页

@heaven522

heaven522

2024-10-21 14:18:48 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

LLM（大语言模型）深度解析

语言建模的研究始于20世纪90年代，最初采用了统计学习方法，通过前面的词汇来预测下一个词汇。然而，这种方法在理解复杂语言规则方面存在一定局限性。随后，研究人员不断尝试改进，其中在2003年，深度学习先驱Bengio在他的经典论文《A Neural Probabilistic Language Model》中，首次将深度学习的思想融入到语言模型中，使用了更强大的神经网络模型，这相当于为计算机提供了更

#语言模型 #人工智能 #自然语言处理 +3

大语言模型的微调方法_大语言模型六种微调方法，零基础入门到精通，收藏这一篇就够了

自2018年BERT发布以来，“预训练+微调”成为语言模型的通用范式。以ChatGPT为代表的大语言模型针对不同任务构造Prompt来训练，本质上仍然是预训练与微调的使用范式。千亿规模的参数微调需要大量算力，即使提供了预训练的基座模型，一般的研究机构也很难对其进行全量微调（即对所有参数进行微调）。为了应对这个问题，相关学者提出了PEFT（Parameter-Efficient Fine-Tunin

#语言模型 #人工智能 #自然语言处理 +3

【AI大模型】羊驼大模型详解_零基础入门到精通，看完这篇就足够了~

可能大家都想学习AI大模型技术，也想通过这项技能真正达到升职加薪，就业或是副业的目的，但是不知道该如何开始学习，因为网上的资料太多太杂乱了，如果不能系统的学习就相当于是白学。原生的基础LLaMa用的语料是通用语料。微调的本质并不是能把模型效果变好，微调的目的是让模型更适应于我们的数据。作为普通人，入局大模型时代需要持续学习和实践，不断提高自己的技能和认知水平，同时也需要有责任感和伦理意识，为人工智

#人工智能 #语言模型 #学习 +2

AI打造“魔法博物馆”，五分钟完成一件“3D展品”

注意看，这是一家“魔法博物馆”，陈列的展品琳琅满目，甚至还有机甲套装……魔法镜子、水晶法杖……也是一应俱全，仿佛真的进入了魔法世界。没错，这个“博物馆”里的“展品”全都是由AI打造的，而且一件只需要五分钟。来自南洋理工大学、上海AI实验室等机构的研究人员，共同推出了新款文生3D基础模型。只需要一组文本，它就可以在5分钟内生成出多样化、高精度的3D模型。除了“魔法博物馆”里的展品之外，日常的物品3D

#人工智能 #AIGC #系统架构

大模型部署工具 llama.cpp 介绍与安装使用_看完这篇就够了

这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。训练的过程，实际上就是在寻找模型参数，使得模型的损失函数最小化，推理结果最优化的过程。训练完成之后，模型的参数就固定了，这时候就可以使用模型进行推理，对外提供服务。作为普通人，入局大模型时代需要持续学习和实践，不断提高自己的技能和认知水平，同时也需要有责任感和伦理意识，为人工智能的

#人工智能 #linux #运维 +2

想转行做大模型？AI产品经理们，先看看这份指南再考虑吧！

大模型是AI领域的一个重要趋势，具有强大的泛化能力和适应能力，在多个任务和领域上表现出惊人的成就。大模型可以利用海量的数据来学习通用的知识和能力，从而在多个场景和需求上提供高效的解决方案。大模型可以带来更好的用户体验和商业价值，在各个行业和领域中创造更多的创新和变革转行做。大模型需要海量的数据和计算资源来训练和运行，对于硬件设备、网络带宽、存储空间等方面有很高的要求。大模型涉及到很多前沿的理论和实

#人工智能 #产品经理 #安全 +2

【AI大模型】应用开发基础，学到就是赚到！零基础入门到精通，看完这篇就足够了~

1、了解大模型能做什么2、整体了解大模型应用开发技术栈3、浅尝OpenAI API的调用AI全栈工程师：懂AI、懂编程、懂业务的超级个体，会是AGI（Artificial General Intelligence 通用人工智能）时代最重要的人。

#人工智能 #学习 #前端 +2

【大模型微调】一文掌握7种大模型微调的方法，零基础入门到精通，收藏这一篇就够了

本篇文章深入分析了大型模型微调的基本理念和多样化技术，细致介绍了LoRA、适配器调整(Adapter Tuning)、前缀调整(Prefix Tuning)等多个微调方法。详细讨论了每一种策略的基本原则、主要优点以及适宜应用场景，使得读者可以依据特定的应用要求和计算资源限制，挑选最适合的微调方案。大型语言模型(LLM)的训练过程通常分为两大阶段：阶段一：预训练阶段在这个阶段，大型模型会在大规模的无

#深度学习 #人工智能 #自然语言处理 +4

【AI大模型】应用开发基础，学到就是赚到！零基础入门到精通，看完这篇就足够了~

#人工智能 #前端 #机器人 +2

中国大模型商业化提速：不仅企业赚钱，也让个人赚钱_视频大模型的书籍

最后，通过这些产品的上线，即便是不懂IT技术的小白也能成为AI行业的一份子，或者说，也让无数不懂技术的AI爱好者看到这样的可能性。这显然对大模型“真实应用”时代的早日到来助益颇丰。

#自然语言处理 #人工智能 #深度学习

共 61 条

请选择