logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

用大模型学大模型01-制定学习计划

1.1 数学基础1.2 编程基础2.1 监督学习2.2 无监督学习2.3 经典资源3.1 神经网络基础3.2 框架实践4.1 词嵌入与序列模型4.2 实践项目5.1 Transformer架构5.2 预训练模型6.1 训练全流程6.2 模型压缩7.1 垂直领域应用7.2 行业案例8.1 前沿方向8.2 社区与资源。

文章图片
#学习#人工智能
用deepseek学大模型03-数学基础 概率论 条件概率 全概率公式 贝叶斯定理

通过以上实例可以看出,条件概率和贝叶斯定理在实际问题中具有广泛的应用价值。医学诊断:根据患者的症状和检测结果,计算患病的可能性。自然语言处理:根据文本特征和语料库,预测文本的主题或情感。机器学习:朴素贝叶斯分类器利用贝叶斯定理进行分类预测。学习这些概念时,建议结合具体问题进行练习,并逐步深入理解其背后的数学原理和应用场景。希望这个入门级教程能帮助你更好地掌握条件概率与贝叶斯定理!

#概率论#人工智能
用deepseek学大模型04-模型与网络

目前已经学完深度学习的数学基础,开始学习各种 模型和网络阶段,给出一个从简单到入门的,层层递进的学习路线。并给出学习每种模型需要的前置知识。增加注意力机制,bert, 大模型,gpt, transformer, MOE等流行的模型。另外,前置知识详细一点,加上需要前置学习的模型。并分析每种模型的使用场景,优缺点。

文章图片
#网络
大模型系统(SysML)与应用工程优化

摘要:针对具备后端开发背景的计算机硕士,本文提出一套从零发表AI论文的四阶段路线:1)1-2个月夯实Transformer理论基础与工具链;2)2-3个月聚焦工程优势方向(高效微调/推理加速/RAG);3)3-5个月实施"小而美"创新(借鉴跨领域技术/垂直场景优化);4)优先投稿顶会Workshop。建议利用现有硬件(如5060显卡)开展7B-14B模型实验,结合工程直觉(如分

#人工智能
告别K8s配置“屎山”:我用Kurator治好了团队的环境分裂症

本文分享了团队使用Kurator工具解决Kubernetes多环境配置管理难题的实践经验。面对开发、测试、生产等多套环境配置混乱、部署风险高的问题,团队发现传统的Kustomize和Helm工具在复杂场景下存在环境继承关系隐晦、配置差异对比困难等痛点。Kurator通过将"环境"作为核心概念,实现了集群配置与部署逻辑的解耦,提供了一键多集群部署、可视化配置差异对比、渐进式发布等

#运维#java#开发语言
机器问道:大模型RAG 解读凡人修仙传

本文介绍了一个基于Qwen3-0.6B嵌入模型的中文文本处理流程,主要功能包括:1)使用SemanticChunker对多本小说进行语义分块处理;2)利用HuggingFaceEmbeddings生成文本向量;3)将处理结果存入Chroma向量数据库。代码实现了自动加载文本文件、中文优化的语义分割、元数据添加及持久化存储功能,并提供查询接口检索相似文本片段。该系统特别针对中文文本特点进行了优化,包

文章图片
#python#人工智能#transformer
用deepseek学大模型04-机器学习建模过程

设置网络层数、激活函数(如ReLU、Sigmoid)、Dropout率(防止过拟合)、优化器(如Adam、SGD)等。

文章图片
#机器学习#人工智能
用deepseek学大模型02-数学基础 微积分

导数:衡量单变量函数变化率。偏导数与梯度:多变量函数的局部变化率与全局方向。链式法则:反向传播的数学基础,逐层计算梯度。梯度下降法:利用负梯度方向更新参数,最小化损失函数。通过理解这些概念并实践代码示例,可掌握深度学习优化算法的数学本质。

#人工智能
用deepseek学大模型02-数学基础

线性代数概率论与统计学微积分优化理论分阶段学习工具辅助实践资源推荐分享:秘塔AI搜索

文章图片
#人工智能
    共 33 条
  • 1
  • 2
  • 3
  • 4
  • 请选择