logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

PyTorch 自动微分:从计算图到梯度回传的工程实践

在复杂模型中,梯度消失或爆炸是常见问题。"""检查模型参数梯度健康状态,返回异常参数名与诊断信息"""diagnosis[name] = "梯度为 None,可能未参与计算图"continuediagnosis[name] = f"梯度含 NaN,范数={grad_norm:.4f}"diagnosis[name] = f"梯度含 Inf,范数={grad_norm:.4f}"diagnosis[

#python#机器学习#深度学习 +1
深度学习模型部署:从 PyTorch 到 ONNX Runtime 的推理加速路径

模型部署是深度学习工程化的关键环节,将训练好的模型从实验室推向生产环境需要系统化的格式转换和推理优化。核心要点如下:第一,ONNX 是当前最成熟的跨框架模型格式,通过标准化的算子集和计算图规范,解耦了训练框架与推理引擎的选择。第二,推理引擎的图优化(算子融合、常量折叠、内存规划)是加速的核心来源,通常可提供 1.5x-3x 的加速,无需修改模型结构。第三,量化是进一步提升推理性能的重要手段,INT

#python#机器学习#深度学习 +1
PyTorch 训练流程优化:从数据加载到梯度累积的工程化实践

PyTorch 训练流程优化是一个系统性工程问题,需要从数据加载、计算精度、显存管理三个维度协同发力。核心要点如下:第一,数据加载优化是投入产出比最高的手段。pin_memory三项配置的组合通常可将 GPU 利用率提升 20%-40%,且几乎不增加代码复杂度。第二,混合精度训练在大多数视觉和 NLP 任务中可提供 1.5x-2x 的训练加速,但必须验证最终指标与 FP32 基线的一致性,并在自定

#python#机器学习#深度学习 +1
RAG系统评估:检索质量与生成质量的联合评测方法

RAG 系统的评估必须同时关注检索质量和生成质量,以及两者的协同效果。忠实度优先:先建立忠实度评估,这是 RAG 系统最核心的质量指标。检索-生成联合:不要单独评估检索或生成,关注端到端的答案质量。幻觉监控:将幻觉率纳入日常监控,超过阈值触发知识库或检索策略的优化。人工校准:定期用人工评估校准自动化指标,确保评测结果与用户感知一致。

文章图片
#python#机器学习#深度学习 +1
Prompt Engineering 系统化方法论:从零样本到思维链的提示词设计模式

Prompt Engineering 的本质是将"试错式调优"转化为"模式化设计 + 系统化评估 + 迭代优化"的工程流程。本文方案的核心链路为:选择设计模式 → 模板化编写 → 自动化评估 → 基于结果的迭代优化。落地时需重点关注三个参数:评估样本量(建议至少 100 条)、准确率阈值(建议 85% 以上)、格式合规率阈值(建议 95% 以上)。建议建立 Prompt 版本管理和评估报告体系,每

#python#机器学习#深度学习 +1
Flutter for OpenHarmony:Flutter 三方库 nanoid —— 斩杀臃肿 UUID 的新一代紧凑型唯一标识引擎(适配鸿蒙 HarmonyOS Next ohos)

本文介绍了在开源鸿蒙跨平台开发中使用nanoid替代传统UUID生成唯一标识符的方案。nanoid通过密码学真随机机制和64字符集编码,可生成更短小(21字符)、URL友好且防碰撞的ID,性能优于36字符的UUID。文章详细解析了nanoid原理、核心API及自定义规则功能,并提供了Flutter代码示例,包括生成标准ID、定制长度ID和易辨认验证码。同时指出在OpenHarmony平台上需确保底

文章图片
#flutter#harmonyos#华为 +2
Flutter 三方库 tiktoken_tokenizer_gpt4o_o1 的鸿蒙化适配指南 - 让 AIGC 拥有“精准标尺”,打造鸿蒙应用专家级的 Token 计算中台

在鸿蒙(OpenHarmony)应用进军 AIGC(人工智能生成内容)与大模型集成的进程中,如何实现在鸿蒙手机或平板上执行与 OpenAI 官方完全一致的文本分词(Tokenization)?由于 API 调用通常按 Token 计费且有上下文长度限制(Context Window),在端侧进行精准的 Token 预计算至关重要。是一款专门为 GPT-4o 及最新的 o1 系列模型优化的分词工具。

文章图片
#flutter#harmonyos#鸿蒙
大语言模型的微调策略:原理与实践

大语言模型(LLM)如GPT-3、Llama等在自然语言处理任务中展现出强大的能力,但直接使用预训练模型往往不能满足特定领域的需求。微调(Fine-tuning)是将预训练模型适应特定任务的关键技术。本文将深入探讨大语言模型的微调原理,介绍常用的微调策略,并提供实践案例。

文章图片
#flutter#harmonyos#鸿蒙
论文复现方法论:从阅读到验证的系统化实践框架

论文复现的核心原则是"模块化验证,逐步对齐"。本文的四阶段流程为:精读提取 → 基线搭建 → 逐步对齐 → 消融验证。关键工具为:论文信息提取模板(识别省略信息)、模块级验证器(逐层对比中间输出)、偏差追踪器(记录每次实验与论文的差距)。复现偏差超过 5% 时应回溯定位,而非盲目调参。建议优先复现论文开源代码,确认环境一致后再独立实现。补充落地建议:围绕“论文复现方法论:从阅读到验证的系统化实践框

#python#机器学习#深度学习 +1
NLP 注意力机制:从Transformer到GPT

注意力机制的核心思想是根据输入的相关性动态分配权重。其基本计算公式如下:$Q$(Query):查询向量$K$(Key):键向量$V$(Value):值向量$d_k$:键向量的维度,用于缩放点积结果注意力机制的发展推动了NLP领域的重大突破,从Transformer到GPT系列模型的成功证明了其有效性。通过深入理解注意力机制的原理和变体,我们可以更好地设计和优化模型,以应对各种NLP任务的挑战。未来

#python#机器学习#深度学习 +1
    共 661 条
  • 1
  • 2
  • 3
  • 67
  • 请选择