logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【机器学习&深度学习】OpenCompass 如何选择合适的开源数据集 & 自定义数据集

▲如果关注 数学 → GSM8K + MATH;▲如果关注 考试/知识 → MMLU、C-Eval、CMMLU;▲如果关注 常识与事实性 → ARC、Winogrande、TruthfulQA;▲如果关注 对话与指令 → MT-Bench、AlpacaEval;▲如果只想快速跑通 → demo 数据集;合理搭配数据集,才能全面、客观地评估你的模型。

文章图片
#深度学习#人工智能
【git命令操作指南】

复制输出内容,到 GitHub → Settings → SSH and GPG keys → New SSH key→将内容粘贴到“key”,title随便写。一般在团队开发时创建了多个子分支,最终合并到main这个主分支中。以下命令在创建github仓库会有对应的命令,按你创建的仓库所属的对应命令,顺序执行即可。如果LFS解决不了就可以用这个方法,先执行下面命令【1】移除大文件(如果之前有提交

文章图片
#git
【机器学习&深度学习】OpenCompass:支持的开源评估数据集及使用差异

数据集5大类:知识类 → 适合验证模型在教育、知识库问答、搜索增强等场景的能力。推理类 → 适合检验模型在金融决策、法律推理、科学研究等领域的应用价值。语言类 → 适合对话机器人、写作助手、情感计算等场景。代码类 → 适合 AI 辅助编程、自动化测试、软件开发。多模态类 → 适合智能客服、自动驾驶、图文生成、跨模态搜索。

文章图片
#深度学习#人工智能
【机器学习&深度学习】Embedding 与 RAG:让 AI 更“聪明”的秘密

▲RAG 结合知识库与大模型,充分发挥 LLM 的语言能力,弥补其在专业知识与时效性上的不足。知识库:提供可靠、实时更新的信息源。大模型:负责理解与生成自然语言回答。▲Embedding 是 RAG 系统的核心技术,它将文本转化为语义向量,连接知识库与大模型。其魔力在于:语义理解:捕捉文本深层含义,实现精准匹配。高效检索:支持快速、动态的知识查询,无需重训模型。广泛应用:从法律到企业文档,Embe

文章图片
#机器学习#深度学习#人工智能
【机器学习&深度学习】DeepSpeed框架:高效分布式训练的开源利器

DeepSpeed 是微软开发的一个开源分布式训练优化框架,专为大规模深度学习模型设计。其核心目标包括:降低训练成本:通过优化显存和计算效率,支持千亿级参数模型的训练。提升易用性:与PyTorch无缝集成,并兼容Hugging Face Transformers等主流生态。扩展性:支持从单机多卡到千卡级集群的分布式训练。

文章图片
#机器学习#深度学习#人工智能
【机器学习&深度学习】模型微调训练时的评估指标(详细版)

模型微调训练的评估指标是 “模型效果的刻度表”,从基础指标到多分类策略,再到混淆矩阵与综合报告,每个工具都有其独特价值。关键在于 结合任务场景 ,选择最能反映模型核心能力的指标,并通过多维度分析(如指标关系图、混淆矩阵细节)定位优化方向。只有科学评估,才能让模型微调真正 “调得准、效果好”!

文章图片
#机器学习#深度学习#人工智能
【机器学习&深度学习】张量基本操作

张量(Tensor)就是“任意维度的数值容器”,一维、二维、三维、甚至 N 维都可以;所有的矩阵、向量、标量,乃至于多维数组,在 PyTorch 中都是张量;只有 .item() 或 [i][j] 取出的是具体数字(标量),不是张量。

文章图片
#机器学习#深度学习#pytorch
【机器学习&深度学习】 微调的十种形式全解析

微调不只是“继续训练”,而是结合业务、任务和资源进行模型能力“定制”的艺术。从全参数微调到参数高效调优,从领域适应到多任务训练,不同场景下的微调策略千变万化,关键在于理解需求,合理选型。

文章图片
#机器学习#深度学习#人工智能
【机器学习&深度学习】Embedding 模型详解:从基础原理到实际应用场景

Embedding 是将文本等信息转化为向量,并通过相似度计算实现语义理解与应用的核心技术。

文章图片
#机器学习#深度学习
【机器学习&深度学习】偏置项(Bias)概念

偏置项不是多余的小数值,而是让模型从“死板判断”变成“灵活思考”的关键组件。

文章图片
#机器学习#深度学习#人工智能
    共 149 条
  • 1
  • 2
  • 3
  • 15
  • 请选择