weixin_55136196 个人主页

@weixin_55136196

weixin_55136196

2024-01-04 08:50:37 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

AIAgent应用开发——大模型理论基础与应用（六）

本文介绍了提示词工程的核心技巧与应用。迭代技巧强调通过设定角色、结构化提问明确需求，利用多轮互动和提问替代评价来优化反馈，并通过增加约束、提供示例使指令更精准。自动化提示词工程则利用AI自主构造和优化提示词，提升复杂任务的沟通效率。此外，文章还提供了多种实用模式，如“说人话模式”促进理解、“杠精模式”拓展思维。最后，根据任务性质选择通用模型V3（高效）或推理模型R1（深度），可发挥最佳效果。

#人工智能 #python #DeepSeek

AIAgent应用开发——大模型理论基础与应用（五）

摘要：提示词是引导AI输出的关键指令，其质量直接影响结果。高质量提示词需明确目标、提供背景信息并规范输出要求。常见形式包括指令式、问答式、创意生成式等，编写时需结合清晰指令、角色设定及迭代优化。提示词工程通过设计优化指令提升AI效率，适用各行业。常用框架如TASTE、ALIGN等结构化提示词设计，帮助AI精准响应复杂需求。掌握提示词技巧能显著提升AI协作效果，释放其创新潜力。

#人工智能 #python

AIAgent应用开发——DeepSeek分析（二）

DeepSeek采用多阶段训练策略（冷启动微调、强化学习、监督微调和对齐），结合MoE架构和MLA机制提升性能。其创新点包括GRPO算法降低30%计算量、FP8混合精度训练提升2.1倍速度，以及动态算子优化实现3270 token/s的推理吞吐。通过知识蒸馏和动态精度切换等技术，训练成本显著降低。虽然存在蒸馏技术争议和;幻觉;问题，但采用RAG、置信度评分等方法应对。DeepSeek展现出多模态处

#人工智能 #python #DeepSeek +1

AIAgent应用开发——DeepSeek分析（一）

DeepSeek是中国团队研发的开源大语言模型项目，具有混合专家系统(MoE)和自研MLA技术等创新架构，在保持高性能的同时显著降低成本。其提供V3和R1两个版本，分别适用于通用和专业场景，支持智能对话、代码开发和多模态处理等功能。通过开源策略构建生态体系，DeepSeek降低AI使用门槛，但也面临可靠性、多轮对话等技术挑战。该项目通过模型创新、训练优化和数据筛选实现成本优势，为AI普及提供新思路

#人工智能 #python #深度学习

AIAgent应用开发——大模型理论基础与应用（二）

本文系统介绍了大语言模型的训练过程与技术要点。训练分为三个阶段：预训练阶段通过自监督学习构建语言知识库；监督微调阶段让模型掌握具体任务；强化学习阶段通过人类反馈优化模型行为。关键技术包括数据预处理、Transformer架构设计、分布式训练等。文章还分析了模型存在的理解缺失、知识时效性等局限，并展望了多模态、持续学习等发展方向。全文从技术实现到应用挑战，全面剖析了大语言模型的训练机理与演进趋势。

#人工智能 #python

AIAgent应用开发——大模型基础理论与应用（一）

摘要本文系统阐述了自然语言处理中的向量化技术和Transformer架构原理。向量化通过赋予词语多维特征参数实现语义表达，是语言模型的基础工具。Transformer采用注意力机制取代传统RNN结构，通过并行计算和长程依赖捕捉显著提升了语言处理能力。文章详细解析了Transformer的点积注意力、并行计算等核心机制，同时指出其计算复杂度高的局限性。此外，还概述了大语言模型从输入处理到输出生成的

#人工智能 #python #深度学习 +1

AIAgent应用开发——人工智能通识基础（四）

摘要：本文系统介绍了深度学习的关键技术与原理。首先阐述了反向传播算法、神经认知机和自编码器三项核心技术，分别解决了权重调整、多层网络训练和特征提取问题。其次探讨了深度学习的诞生历程，重点分析了预训练与微调机制及其划时代意义。然后介绍了深度强化学习的核心机制，包括DQN算法和AlphaGo的工作原理。最后解析了卷积神经网络和循环神经网络的基本原理，前者通过卷积池化实现图像特征提取，后者通过记忆机制处

#人工智能 #python #神经网络 +1

AIAgent应用开发——人工智能通识基础（三）

监督学习通过标注数据训练模型，实现图像识别、医疗诊断等应用，但面临数据标注成本高和过拟合问题。无监督学习则自主发现数据内在规律，用于客户分群和异常检测。强化学习通过奖励机制引导学习，适用于动态决策场景。大数据与云计算的结合推动了机器学习发展，深度学习则借助反向传播算法实现多层神经网络训练。这些方法各有特点，在不同领域发挥重要作用。

#人工智能 #python #深度学习

AIAgent应用开发——人工智能通识基础（二）

本文梳理人工智能基础发展脉络与核心理论：符号主义作为 AI 开端，以逻辑推理为核心曾成主流，因常识处理短板遇阻，后借深度学习 “黑箱” 问题回归；人工神经网络模拟生物神经元，感知机的权重调整与梯度下降机制成为深度学习基础，与符号主义形成 “感性” 与 “理性” 大脑的互补。同时介绍 AI 智能判定标准，图灵测试通过对话判断机器智能却易受干扰，早期聊天机器人也印证 “类人表达≠智能”。此外，阐释了人

#人工智能

AIAgent应用开发——人工智能通识基础（二）

#人工智能

共 14 条

请选择