logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大语言模型的训练过程是怎样的?用通俗的方式介绍

大语言模型(LLM)训练分为三个阶段:预训练(Pretrain)、监督微调(SFT)和基于反馈的强化学习(RLHF)。预训练阶段通过海量文本数据让模型学习语言规律和基础知识;SFT阶段使用高质量问答数据教会模型遵循指令;RLHF阶段通过人类反馈优化模型输出,使其更符合人类价值观。整个过程从知识积累到行为规范,最终形成符合3H原则(Helpful、Honest、Harmless)的智能助手。随着AI

文章图片
#语言模型#人工智能#深度学习
大语言模型的训练过程是怎样的?用通俗的方式介绍

大语言模型(LLM)训练分为三个阶段:预训练(Pretrain)、监督微调(SFT)和基于反馈的强化学习(RLHF)。预训练阶段通过海量文本数据让模型学习语言规律和基础知识;SFT阶段使用高质量问答数据教会模型遵循指令;RLHF阶段通过人类反馈优化模型输出,使其更符合人类价值观。整个过程从知识积累到行为规范,最终形成符合3H原则(Helpful、Honest、Harmless)的智能助手。随着AI

文章图片
#语言模型#人工智能#深度学习
一文讲清:AI大模型预训练与后训练的数据选择

基于模型实时状态的动态数据筛选机制,相比固定规则策略具有显著优势,代表了预训练数据管理技术的重要发展方向。

文章图片
#人工智能#机器学习#深度学习 +1
一文讲清:AI大模型预训练与后训练的数据选择

基于模型实时状态的动态数据筛选机制,相比固定规则策略具有显著优势,代表了预训练数据管理技术的重要发展方向。

文章图片
#人工智能#机器学习#深度学习 +1
Weaviate 官方发布:上下文工程 ——LLM 实用化的核心架构设计

大型语言模型开发的瓶颈与突破之道 摘要:大型语言模型(LLM)在实际应用中面临三大核心瓶颈:无法访问私有数据、缺乏实时信息、产生幻觉回答。这些限制源于模型的孤立性本质和有限的上下文窗口。为突破这些瓶颈,需要构建"上下文工程"系统,包含六大核心组件:智能体(决策核心)、查询增强(意图理解)、检索(知识连接)、提示词技术(指令优化)、记忆(历史学习)和工具(实时交互)。其中智能体作

文章图片
#人工智能#语言模型
Weaviate 官方发布:上下文工程 ——LLM 实用化的核心架构设计

大型语言模型开发的瓶颈与突破之道 摘要:大型语言模型(LLM)在实际应用中面临三大核心瓶颈:无法访问私有数据、缺乏实时信息、产生幻觉回答。这些限制源于模型的孤立性本质和有限的上下文窗口。为突破这些瓶颈,需要构建"上下文工程"系统,包含六大核心组件:智能体(决策核心)、查询增强(意图理解)、检索(知识连接)、提示词技术(指令优化)、记忆(历史学习)和工具(实时交互)。其中智能体作

文章图片
#人工智能#语言模型
AI如何理解我们的世界?- Embedding

摘要: 嵌入(Embeddings)是AI理解复杂世界的关键技术,它将文字、图像等对象转换为数字向量,捕捉其内在关系。通过降维处理,嵌入技术高效压缩高维数据,保留核心语义。相比传统的独热编码,嵌入能识别相似性(如“鸟巢”和“狮穴”)和反义关系(如“昼夜”)。现代模型(如BERT)更进一步,结合语境动态调整词义表示。嵌入通过机器学习不断优化,驱动推荐系统、大语言模型等AI应用,成为机器理解人类语言与

文章图片
#人工智能#语言模型
了解视觉语言大模型(VLM),你需要知道哪些内容?

摘要: 视觉语言模型(VLM)融合计算机视觉与自然语言处理,具备跨模态理解能力,支持图像分类、视觉问答等任务。相比传统CV模型,VLM泛化性强,无需针对特定任务重新训练。其核心组件包括视觉编码器和语言编码器,通过多阶段训练实现文本与图像的语义对齐。应用场景涵盖图像生成、搜索、分割及视觉问答等。随着AI大模型快速发展,VLM成为新兴领域的重要方向,人才需求激增。学习VLM需系统化路径,现有资源可助力

文章图片
#人工智能#语言模型
了解视觉语言大模型(VLM),你需要知道哪些内容?

摘要: 视觉语言模型(VLM)融合计算机视觉与自然语言处理,具备跨模态理解能力,支持图像分类、视觉问答等任务。相比传统CV模型,VLM泛化性强,无需针对特定任务重新训练。其核心组件包括视觉编码器和语言编码器,通过多阶段训练实现文本与图像的语义对齐。应用场景涵盖图像生成、搜索、分割及视觉问答等。随着AI大模型快速发展,VLM成为新兴领域的重要方向,人才需求激增。学习VLM需系统化路径,现有资源可助力

文章图片
#人工智能#语言模型
智能体记忆机制演进之路:从RAG到智能体记忆的演进

本文探讨了AI智能体记忆机制的演进过程,从最初的检索增强生成(RAG)到智能体RAG,再到智能体记忆系统。RAG通过外部知识源增强LLM回答,智能体RAG将其发展为工具调用形式,而智能体记忆则进一步实现了信息的读写功能。文章指出智能体记忆通过记忆管理系统,不仅能检索还能存储信息,使AI具备学习能力。虽然这是一个简化模型,实际实现涉及更复杂的记忆分类和管理策略。文章最后强调AI领域快速发展,鼓励读者

文章图片
#数据库#人工智能#语言模型
    共 265 条
  • 1
  • 2
  • 3
  • 27
  • 请选择