logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

2025初学者怎么入门大语言模型(LLM)?零基础入门到精通,收藏这篇就够了

大语言模型(LLM)是一门博大精深的学科,涉及到高等数学、python编程、PyTorch/Tensorflow/Onnx等深度学习框架……然而奇妙的是,越是看上去难得要死、一辈子都学不完的技术,入门起来却越是容易。正如阿瑟·克拉克的名言:足够先进的科技看上去与魔法无异。大语言模型先进得如同魔法,我们这些麻瓜也许一辈子都没法完全理解它。但乐观地看,既然大语言模型是魔法,那我们就把它当魔法用好了,用

文章图片
#语言模型#人工智能#自然语言处理 +3
5个好用的中文AI大语言模型_中文大模型

AI大语言模型(Large Language Models, LLMs)是近1-2年来人工智能领域的重要发展,它们通过深度学习技术,特别是基于Transformer的架构(如GPT、BERT等),实现了对自然语言处理的巨大突破。AI大语言模型的主要功能和作用有:文本生成、创意写作、对话生成、问答系统、文本翻译、代码生成、代码解释、文档生成、辅助写作、辅助设计等。1.讯飞星火大模型-AI大语言模型-

文章图片
#人工智能#语言模型#自然语言处理
盘点2024年最佳大语言模型

大语言模型(LLM)用于理解和生成自然语言和编程语言的人工智能模型。它可以帮助完成适用程度和成本效率不同的各种任务。本文通过测试来自同一基础模型的多个独立模型,以找到最佳的大语言模型。这一技术领域发展迅猛,尽管本文已尽可能保持时效性,也还是需要读者随时关注最新发布的模型,根据成本效益判断该模型是否更佳。官方网站:https://openai.com/图片来源:Unsplash。

文章图片
#语言模型#人工智能#自然语言处理 +2
专题解读 大语言模型上下文窗口扩展方法

YaRN和SelfExtend分别在微调和推理阶段提供了有效的上下文窗口扩展方案,前者通过优化位置嵌入插值和动态缩放,后者通过双层注意力机制扩展了模型的上下文处理能力。两者在不同应用场景下都表现出色,为大语言模型的长文本处理提供了新的技术路径。

文章图片
#语言模型#人工智能#深度学习 +3
一文详解大语言模型的流行架构与训练技术

这篇博客全面介绍了大型语言模型(LLMs)的构建流程,从流行架构的选择到实际建模的每个关键步骤。文章首先探讨了LLMs的模型架构,然后详细阐述了数据准备过程,包括数据的收集、清洗和去重,接着是关于如何进行有效标记化的讨论。在模型构建方面,博客详细解释了采用自监督学习方法的预训练过程,以及对模型进行指令微调和对齐的重要性。每个环节都被细致地讲解,使读者能够深入理解LLMs的构建和优化过程。这篇博客为

文章图片
#语言模型#架构#人工智能 +4
一文搞定 大语言模型(LLM)微调方法

众所周知,大语言模型(LLM)正在飞速发展,各行业都有了自己的大模型。其中,大模型微调技术在此过程中起到了非常关键的作用,它提升了模型的生成效率和适应性,使其能够在多样化的应用场景中发挥更大的价值。那么,今天这篇文章就带大家深入了解大模型微调。其中主要包括什么是大模型微调、什么时候需要大模型微调、大模型微调方法总结、大模型微调最佳实践等。在介绍大模型微调方法之前,首先带大家了解一下大语言模型的项目

文章图片
#语言模型#人工智能#深度学习 +2
快速训练自己的大语言模型:基于LLAMA-7B的lora指令微调

转换完毕之后,在 lit-llama/checkpoints/lit-llama/7B 位置,会得到大小为26G左右的 lit-llama.pth 文件,在上一级目录(lit-llama/checkpoints/lit-llama)还有一个tokenizer.model文件。该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又

文章图片
#语言模型#人工智能#深度学习 +3
国内外大语言模型全览:从文心一言到纳米AI,一文读懂典型代表!零基础入门到精通,看这篇就够了!赶紧收藏!

*1. GPT系列(OpenAI)• 版本:GPT-3、GPT-3.5、GPT-4。• 特点:基于Transformer架构,训练数据覆盖面广,支持上下文理解、多轮对话、代码生成等。• 应用:聊天机器人、代码辅助、内容生成、知识问答等。2. PaLM系列(Google DeepMind)• 版本:PaLM、PaLM 2。• 特点:支持多语言任务,注重推理能力和高效训练。• 应用:文本生成、翻译、信

文章图片
#人工智能#语言模型#oracle +2
大语言模型简史:从Transformer(2017)到DeepSeek-R1(2025)的进化之路

语言模型」是一种「人工智能系统」,旨在处理、理解和生成类似人类的语言。它们从大型数据集中学习模式和结构,使得能够产生连贯且上下文相关的文本,应用于翻译、摘要、聊天机器人和内容生成等领域。

文章图片
#语言模型#transformer#人工智能
    共 293 条
  • 1
  • 2
  • 3
  • 30
  • 请选择