logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

codex features

OpenAI Codex 功能开关状态概览 该文档详细分类了 OpenAI Codex 的各项功能状态,分为四个主要类别: 稳定版功能(🟢):包含15个成熟可用的核心功能,如跨应用操作(apps)、浏览器控制(browser_use)、高性能模式(fast_mode)等,适合生产环境使用。 开发中功能(🟡):列出18个正在开发的功能,如灵活补丁应用(apply_patch_freeform)、

#人工智能
用deepseek学大模型02-数学基础 微积分

导数:衡量单变量函数变化率。偏导数与梯度:多变量函数的局部变化率与全局方向。链式法则:反向传播的数学基础,逐层计算梯度。梯度下降法:利用负梯度方向更新参数,最小化损失函数。通过理解这些概念并实践代码示例,可掌握深度学习优化算法的数学本质。

#人工智能
用deepseek学大模型07-激活函数和损失函数

激活函数输出范围梯度特性计算成本适用场景Sigmoid(0,1)最大0.25高二分类输出层Tanh(-1,1)最大1.0高RNN隐藏层ReLU[0, +∞)0或1低通用隐藏层Leaky ReLU(-∞, +∞)0.01或1低避免神经元死亡Softmax[0,1] (概率)依赖输入分布高多分类输出层。

#算法
用deepseek学大模型02-数学基础 奇异值分解(Singular Value Decomposition,简称SVD)

奇异值分解(SVD)是一种强大的线性代数工具,不仅在理论上有重要意义,还在实际应用中展现了广泛的应用价值。通过学习SVD,可以更好地理解矩阵的性质及其在深度学习中的作用。希望以上内容能帮助你掌握SVD的基础知识,并理解其在深度学习中的重要性。SVD(奇异值分解)是一种重要的降维技术,广泛应用于多个领域,包括推荐系统、图像处理、文本挖掘等。SVD作为一种经典的降维技术,因其简单性和高效性,在多个领域

文章图片
#人工智能
用deepseek学大模型08-循环神经网络

通过上述步骤,您可系统掌握 RNN 的核心理论、实现及优化方法。控制历史信息保留,避免传统 RNN 的连乘梯度,缓解消失问题。,导致梯度消失/爆炸。LSTM 通过细胞状态。

文章图片
#rnn#深度学习#人工智能
codex features

OpenAI Codex 功能开关状态概览 该文档详细分类了 OpenAI Codex 的各项功能状态,分为四个主要类别: 稳定版功能(🟢):包含15个成熟可用的核心功能,如跨应用操作(apps)、浏览器控制(browser_use)、高性能模式(fast_mode)等,适合生产环境使用。 开发中功能(🟡):列出18个正在开发的功能,如灵活补丁应用(apply_patch_freeform)、

#人工智能
用大模型学大模型01-制定学习计划

1.1 数学基础1.2 编程基础2.1 监督学习2.2 无监督学习2.3 经典资源3.1 神经网络基础3.2 框架实践4.1 词嵌入与序列模型4.2 实践项目5.1 Transformer架构5.2 预训练模型6.1 训练全流程6.2 模型压缩7.1 垂直领域应用7.2 行业案例8.1 前沿方向8.2 社区与资源。

文章图片
#学习#人工智能
大模型系统(SysML)与应用工程优化

摘要:针对具备后端开发背景的计算机硕士,本文提出一套从零发表AI论文的四阶段路线:1)1-2个月夯实Transformer理论基础与工具链;2)2-3个月聚焦工程优势方向(高效微调/推理加速/RAG);3)3-5个月实施"小而美"创新(借鉴跨领域技术/垂直场景优化);4)优先投稿顶会Workshop。建议利用现有硬件(如5060显卡)开展7B-14B模型实验,结合工程直觉(如分

#人工智能
告别K8s配置“屎山”:我用Kurator治好了团队的环境分裂症

本文分享了团队使用Kurator工具解决Kubernetes多环境配置管理难题的实践经验。面对开发、测试、生产等多套环境配置混乱、部署风险高的问题,团队发现传统的Kustomize和Helm工具在复杂场景下存在环境继承关系隐晦、配置差异对比困难等痛点。Kurator通过将"环境"作为核心概念,实现了集群配置与部署逻辑的解耦,提供了一键多集群部署、可视化配置差异对比、渐进式发布等

#运维#java#开发语言
    共 28 条
  • 1
  • 2
  • 3
  • 请选择