logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【珍藏必学】解锁大模型文本编码潜力:三种高效微调策略详解与实战指南

文章介绍了提升大语言模型(LLM)文本编码能力的三种技术路线:1)直接使用预训练模型隐藏状态,零成本但效果有限;2)微调编码头,包括分类任务和相似度度量两种方式,能显著提升特定任务性能;3)专为RAG场景微调,使用bi-encoder结构实现高效检索。这三种方法代表了成本与效果的不同权衡,选择合适策略可显著提升大模型应用效果,实现"四两拨千斤"。

文章图片
#人工智能#学习#产品经理
【珍藏必学】解锁大模型文本编码潜力:三种高效微调策略详解与实战指南

文章介绍了提升大语言模型(LLM)文本编码能力的三种技术路线:1)直接使用预训练模型隐藏状态,零成本但效果有限;2)微调编码头,包括分类任务和相似度度量两种方式,能显著提升特定任务性能;3)专为RAG场景微调,使用bi-encoder结构实现高效检索。这三种方法代表了成本与效果的不同权衡,选择合适策略可显著提升大模型应用效果,实现"四两拨千斤"。

文章图片
#人工智能#学习#产品经理
收藏学习:大模型应用开发中提示词工程与上下文工程的核心区别与应用

文章解析AIGC应用开发中提示词工程(关注单次对话质量)与上下文工程(关注多轮交互连贯性)的区别。不同应用类型需求不同:聊天助手、Agent和Chatflow依赖上下文工程,工作流和文本生成更需提示词工程。提供系统提示词的Role-Goal-Rules-Few-Shot框架及上下文工程策略,帮助开发者优化AIGC应用性能。

文章图片
#学习#人工智能#产品经理
收藏学习:大模型应用开发中提示词工程与上下文工程的核心区别与应用

文章解析AIGC应用开发中提示词工程(关注单次对话质量)与上下文工程(关注多轮交互连贯性)的区别。不同应用类型需求不同:聊天助手、Agent和Chatflow依赖上下文工程,工作流和文本生成更需提示词工程。提供系统提示词的Role-Goal-Rules-Few-Shot框架及上下文工程策略,帮助开发者优化AIGC应用性能。

文章图片
#学习#人工智能#产品经理
收藏必备!大模型技术深度解析:从基础到PEFT与量化优化全攻略

本文全面介绍大语言模型核心技术,涵盖Transformer架构、预训练与微调流程,以及参数高效微调(PEFT)技术如LoRA、QLoRA和适配器。同时详细讲解模型优化策略,包括量化(GPTQ、NF4)、知识蒸馏和剪枝技术,以及提示工程方法如思维链和ReAct。为开发者提供从基础理论到实践应用的完整技术指南,帮助理解大模型的构建、优化与部署全流程。

文章图片
#人工智能#学习#产品经理
收藏必备!大模型技术深度解析:从基础到PEFT与量化优化全攻略

本文全面介绍大语言模型核心技术,涵盖Transformer架构、预训练与微调流程,以及参数高效微调(PEFT)技术如LoRA、QLoRA和适配器。同时详细讲解模型优化策略,包括量化(GPTQ、NF4)、知识蒸馏和剪枝技术,以及提示工程方法如思维链和ReAct。为开发者提供从基础理论到实践应用的完整技术指南,帮助理解大模型的构建、优化与部署全流程。

文章图片
#人工智能#学习#产品经理
【强烈收藏】AI智能体核心术语大全:30个关键词助你快速入门大模型开发

本文系统梳理了AI智能体领域的30个核心术语,分为四大类:基本构成单元(智能体、环境等)、能力扩展与自我优化(工具、反思等)、记忆知识与约束(上下文窗口、护栏等)、多智能体协作与系统架构(编排、分层智能体等)。这些术语是构建高效AI智能体系统的基础知识,对AI初学者和转行者具有重要参考价值,助你快速掌握Agentic AI开发核心概念。

文章图片
#人工智能#学习#产品经理
【强烈收藏】AI智能体核心术语大全:30个关键词助你快速入门大模型开发

本文系统梳理了AI智能体领域的30个核心术语,分为四大类:基本构成单元(智能体、环境等)、能力扩展与自我优化(工具、反思等)、记忆知识与约束(上下文窗口、护栏等)、多智能体协作与系统架构(编排、分层智能体等)。这些术语是构建高效AI智能体系统的基础知识,对AI初学者和转行者具有重要参考价值,助你快速掌握Agentic AI开发核心概念。

文章图片
#人工智能#学习#产品经理
仅需8G显卡!轻松在本地运行顶尖Llama 3.1大模型,体验AI强大性能!

前几天,Meta发布了他们迄今为止体量最大的开源AI模型——Llama 3.1。这个模型在多项基准测试中表现卓越,甚至优于GPT-4o和Anthropic的Claude 3.5 Sonnet。这次发布的Llama 3.1有三个尺寸:8B(中杯)、70B(大杯)和 405B(超大杯)。相比几个月前发布的小型Llama 3模型,Llama 3.1复杂得多,能力更强。

文章图片
#人工智能#学习#语言模型
通透!一文搞懂大模型、机器学习与深度学习的区别!

机器学习、深度学习和大模型,经常傻傻的分不清,这里将结合图文跟大家讲清楚。假设我们。下面分别是机器学习、深度学习和大模型的实现方式。(1):机器学习一般要针对某个特定场景来进行训练,比如以上的“判断一段文本的情感是正面、负面还是中性”就是典型的一个机器学习场景。(2)

文章图片
#机器学习#深度学习#人工智能 +2
    共 1936 条
  • 1
  • 2
  • 3
  • 194
  • 请选择