logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

思维链(CoT)× 智能体(Agent)× 提示词(Prompt)讲解

本文系统介绍了AI提示工程中的核心概念与进阶方法,涵盖Prompt、CoT(思维链)和Agent三者的定位与边界。文章首先清晰划分了从基础提示词到复杂智能体的技术层次,然后详细阐述了从零样本到思维树搜索的7种增量方法,并提供了可直接复用的代码模板和工程实践建议。针对工程落地,作者给出了输出协议规范、参数调优指南及量化评估指标,强调安全风控措施如沙箱防护和数据合规。最后通过算术、SQL调试等案例展示

深度学习模型性能优化实战之从评估到提升的全流程解析

在构建和使用机器学习模型的过程中,模型的效果评估和优化是两个至关重要的环节。无论模型是用于分类、回归还是其他任务,评估其表现以及持续优化模型性能,都是确保模型在实际应用中取得成功的关键。本节将重点介绍模型效果评估的定义、评估模型性能的重要性以及模型优化的必要性。模型效果评估是指通过一系列指标和方法来衡量机器学习模型在特定任务上的表现。它帮助我们量化模型的预测能力,判断模型是否能够有效地完成给定的任

文章图片
#深度学习#人工智能
深度学习的超参数

在本博客中,我们从超参数的基本概念出发,依次探讨了常见的超参数类型、不同的调优方法,以及在实际场景中如何进行调优实践。超参数调优在大幅提升模型表现的同时,也暗藏了一些“陷阱”,如果不加以注意,可能导致模型性能受到影响或结果解读失误。与模型参数(如神经网络的权重和偏置)不同,超参数在训练过程中是固定的,不会通过数据直接学习得到。在该示例中,Optuna 会根据前几次试验的结果,自动评估下一步试验的超

文章图片
#深度学习#人工智能
GPU在深度学习中的应用与未来发展

深度学习在过去十年中迅速发展,已经成为解决图像识别、自然语言处理和强化学习等众多领域问题的核心技术。随着模型复杂度的增加以及训练数据规模的扩展,深度学习的计算需求不断上升,传统的CPU在应对这些需求时表现出一定的瓶颈。GPU凭借其高并行计算能力和高带宽的数据传输,已经成为加速深度学习模型训练和推理的关键工具。在这一部分中,我们将探讨深度学习的计算需求、GPU的角色,以及CPU与GPU在计算能力上的

文章图片
#深度学习#人工智能
Mixture of Experts与Meta Learning深度学习中的两大变革性技术

是一种通过整合多个“专家”模型来优化计算效率和性能的架构。其核心在于根据输入数据的特性,动态选择部分专家进行计算,而非激活全部模型。例如,使用门控机制(Gating Mechanism)决定哪些专家处理特定任务,从而实现稀疏激活。这种方式显著减少了计算资源的消耗,非常适合处理大规模任务。例如,Google的Switch Transformer利用MoE架构,在语言建模中实现了高效扩展,性能媲美传统

文章图片
#深度学习#人工智能
使用 Python 从 NYU Depth V2 数据集mat文件提取 RGB 图像和深度图

**NYU Depth V2 数据集** 是计算机视觉研究者的宝藏。它包含了丰富的室内场景数据,包括 RGB 图像、深度图、语义标签等,非常适合用于深度估计、语义分割和 3D 场景理解等任务。在这篇博客中,我们将介绍如何使用 Python 从数据集的 `.mat` 文件中提取 RGB 图像和深度图,并将它们保存为 PNG 文件。无论你是为机器学习模型预处理数据,还是仅仅想探索这个数据集,本文都能帮

文章图片
#python#开发语言
梯度消失和梯度爆炸

深度神经网络(DNN)近年来在各种应用领域中表现出色,如计算机视觉、自然语言处理和强化学习等。然而,在训练深层网络时,研究人员和工程师常常会遇到两个棘手的问题——梯度消失和梯度爆炸。这些问题会导致网络难以训练,甚至无法收敛。本文将深入探讨这两个问题,并介绍在参数初始化时如何小心应对,以确保网络能够顺利训练。梯度消失发生在反向传播过程中,尤其是在使用饱和激活函数(如Sigmoid或Tanh)的情况下

文章图片
#dnn#人工智能#神经网络
高效训练之实现多GPU并行训练的最佳实践

在现代深度学习的研究与应用中,模型的复杂性和数据集的规模不断增长。为了有效地训练大型模型,缩短训练时间,多GPU并行训练逐渐成为一种必不可少的技术。多GPU并行训练能够显著提升模型训练的速度和效率。通过将模型或数据分配到多个GPU上,利用其并行计算能力,可以在更短的时间内完成训练任务。这不仅提高了训练效率,也使得研究者和开发者能够更快地迭代和优化模型。显著提升训练速度多GPU并行训练能够有效缩短模

#人工智能#深度学习#机器学习 +1
全面解析表示学习

表示学习(Representation Learning)是机器学习中的一个重要分支,其核心目标是从原始数据中自动学习到能够表达数据特征的有效表示。相比传统的手工特征工程,表示学习能够通过优化学习过程,直接提取出适合任务需求的潜在特征。通俗地说,表示学习试图将复杂的原始数据(如图片、文本、时间序列等)转化为机器能够高效处理的低维向量或特征。

文章图片
#学习#深度学习
PyTorch 避坑到加速解决方案

PyTorch 作为当前最热门的深度学习框架之一,安装过程看似简单,但新手常因环境配置、依赖冲突、镜像源等问题卡在第一步。本文将从 **常见错误分析**、**最佳安装实践**、**镜像加速配置** 三个角度,手把手教你避开 90% 的安装坑!

文章图片
#pytorch#人工智能#python
    共 422 条
  • 1
  • 2
  • 3
  • 43
  • 请选择