logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型入门指南:从“文字接龙”到“数字特工”,小白也能轻松掌握(收藏学习)

大模型是超级统计模型,通过海量数据学习语言规律,而非真正理解。Transformer架构和注意力机制是其核心,使其能处理长文本。大模型通用性强、迁移能力好,但存在幻觉、时效性滞后和复杂逻辑易出错等问题。未来将向多模态和智能体方向发展。使用时应发挥创意、保持警惕,适用于头脑风暴、文字润色等场景,但涉及金钱、医疗等领域需谨慎

#学习#人工智能#产品经理
大模型入门指南:从“文字接龙”到“数字特工”,小白也能轻松掌握(收藏学习)

大模型是超级统计模型,通过海量数据学习语言规律,而非真正理解。Transformer架构和注意力机制是其核心,使其能处理长文本。大模型通用性强、迁移能力好,但存在幻觉、时效性滞后和复杂逻辑易出错等问题。未来将向多模态和智能体方向发展。使用时应发挥创意、保持警惕,适用于头脑风暴、文字润色等场景,但涉及金钱、医疗等领域需谨慎

#学习#人工智能#产品经理
LLM大型语言模型开发流程+开发框架+开发方向全解析,建议收藏!

基于大模型的开发是一个快速发展的领域,涵盖从需求分析到部署优化的完整流程。开发框架如Hugging Face、LangChain等提供了强大的工具支持,而开发方向则覆盖了对话系统、代码辅助、多模态应用等多个领域。未来,随着模型性能提升和计算成本降低,LLM将在更多行业中实现深度应用。开发者需要关注技术迭代,结合具体场景优化模型与系统,以实现高效、可靠的解决方案。如果你真的想学习大模型,请不要去网上

文章图片
#语言模型#人工智能#自然语言处理 +1
AI背后的“思考者“:LLM大语言模型是什么?

大型语言模型(Large Language Models,LLMs)是非常大的深度学习模型,预先在海量数据上进行训练,其底层的 Transformer(在 2017年由谷歌在论文“Attention Is All You Need”中首次提出)是一组神经网络,包括具有自注意力能力的编码器和解码器。编码器和解码器从文本序列中提取意义,并理解其中单词和短语之间的关系。Transformer LLMs能

文章图片
#人工智能#语言模型#自然语言处理 +1
【值得收藏】小白也能懂:大语言模型中的Token、Embedding和Prompt详解

文章介绍了大语言模型的三大核心概念:Token(文本处理基本单位)、Embedding(语义向量表示)和Prompt(输入指令)。Token是模型处理文本的最小单元,Embedding捕捉文本语义,Prompt设计直接影响输出质量。工作流程为:输入Prompt→拆解为Tokens→映射为Embedding→计算语义关系→生成输出→解码为文本。理解这三者的关联对于掌握大语言模型至关重要。

文章图片
#语言模型#深度学习#人工智能
大型语言模型 (LLM)类型和示例

大型语言模型(LLM)是一类深度学习模型,旨在处理和理解海量自然语言数据。简单地说,大型语言模型可以定义为人工智能/机器学习模型,它们试图解决与文本生成、摘要、翻译、问答(Q&A)等相关的 NLP 任务,从而实现更有效的人机交流。这就是为什么 LLM 需要处理和理解海量文本数据,并学习句子中单词之间的模式和关系。大型语言模型(LLM)之所以被称为 “大型”,是因为它们在大型文本语料库中预先训练了大

文章图片
#语言模型#人工智能#自然语言处理
【干货】大语言模型(LLM)微调核心:数据集准备全流程详解,建议收藏!

本文详细介绍了大语言模型(LLM)微调数据集的完整准备流程,包括数据集概念、不同格式选择(原始语料、指令、对话等)、数据来源、Unsloth工具应用、合成数据生成及视觉微调特殊场景处理。通过清晰的代码示例和实际操作建议,帮助读者从零开始打造高质量微调数据集,提升模型性能。

文章图片
#语言模型#人工智能#自然语言处理 +2
【必学收藏】2025向量数据库全解析:AI大模型落地的关键基础设施,从入门到精通指南

文章详细介绍了向量数据库作为AI大模型时代关键基础设施的重要性,系统梳理了开源与闭源两大阵营的各类数据库产品及其技术特点、性能表现和适用场景。针对不同规模数据需求、技术能力和运维成本,提供了针对性的选型建议,帮助开发者解决大模型幻觉、算力成本和数据利用等核心挑战。

文章图片
#人工智能#学习#语言模型 +1
一文揭秘|预训练一个72b模型需要多久?

本文讲述评估和量化训练大规模语言模型,尤其是Qwen2-72B模型,所需的时间、资源和计算能力。update:qwen2公布了技术报告[1]。和本文里依赖的基础信息的基本没差。但训练数据集变成7t了。笔者已经在文章中修正。另外训练语料的长度也是在最后阶段才从4096拓展到32768。所以本文预估的算力需求会有一定程度高估,但不到一倍。

文章图片
#人工智能#搜索引擎#语言模型 +1
【值得收藏】AI Agent入门指南:从“智能代理“到自主思考的AI新突破

AI Agent是由大语言模型驱动的智能系统,具备感知、规划、记忆和工具调用能力,能自动化执行复杂任务。它不同于传统AI,不仅能交互,还能主动感知环境、制定计划并执行行动,表现出独立思考和持续行动能力。文章通过旅行规划等例子,解释了AI Agent如何模拟人类思考过程,将大目标拆解为小目标,结合记忆与工具调用,不断反思调整,直至完成任务。

文章图片
#人工智能#学习#产品经理
    共 2150 条
  • 1
  • 2
  • 3
  • 215
  • 请选择