Shining0596 个人主页

@m0_58153897

Shining0596

3100437103@qq.com

2023-10-17 11:25:32 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

前沿模型系列（二）《科学多模态大模型》

摘要：上海人工智能实验室推出的InternS1科学多模态大模型通过创新架构解决了传统模型在科研场景的局限性。该模型采用三大输入通道（视觉/动态分词/时序）处理科学数据，构建2.5万亿token高质量科学语料库，并开发PDF解析和网页过滤双管线确保数据质量。其MOR混合奖励模型能动态平衡科学严谨性与创造性，配合FP8全链路优化显著提升效率。实际应用中，该模型在数学竞赛、化学解析等任务表现优异，并推出

#人工智能 #学习 #性能优化 +1

数据挖掘与机器学习：数据挖掘算法原理与实践：数据预处理

第一关本关任务：利用sklearn对数据进行标准化。为了完成本关任务，你需要掌握：1.为什么要进行标准化，2.Z-score标准化，3.Min-max标准化，4.MaxAbs标准化。第二关本关任务：利用sklearn对数据进行非线性转换。为了完成本关任务，你需要掌握：1.为什么要非线性转换，2.映射到均匀分布，3.映射到高斯分布。第三关本关任务：利用sklearn对数据进行归一化。第四关、本关任务

#数据挖掘 #其他 #学习

数据挖掘与机器学习：NumPy基础及取值操作

第一关本关任务根据本关所学知识，补全右侧代码编辑器中缺失的代码，完成程序的编写并通过所有测试用例。第二关本关任务根据本关所学知识，补全右侧代码编辑器中缺失的代码，完成程序的编写并通过所有测试用例。第三关本关任务：根据本关所学知识，补全右侧代码编辑器中缺失的代码，完成程序的编写并通过所有测试用例。第四关本关任务根据本关所学知识，补全右侧代码编辑器中缺失的代码，完成程序的编写并通过所有测试用例。第五关

#数据挖掘 #其他 #学习

数据挖掘与机器学习：元组与字典

第一关任务描述元组看起来犹如列表，但元组使用圆括号（）而不是[]来标识，而且列表的元素可以修改，但元组的元素不能修改。本关介绍元组的常见使用方法以及元组和列表的使用区别。第二关任务描述字典和列表一样，都是 Python 中十分重要的可变容器模型，都可以存储任意类型元素。第三关任务描述Python 字典中包含大量数据，它和列表一样，支持遍历操作。第四关任务描述Python 的列表和字典可以存储任意类

#数据挖掘 #python #学习 +1

数据挖掘与机器学习：Python机器学习软件包Scikit-Learn的学习与运用

第一关任务描述使用 scikit-learn 的datasets模块导入 iris 数据集，并打印数据。第二关任务描述在前一关卡，我们已经学会了使用 sklearn 导入数据，然而原始数据总是比较杂乱、不规整的，直接加载至模型中训练，会影响预测效果。第一关至第六关

#python #数据挖掘 #其他 +1

数据挖掘与机器学习：玩转列表

第一关本关任务是对一个给定的列表进行增、删、改等操作，并输出变化后的最终列表。第二关本关的任务是学会列表排序相关操作的使用方法，实现对列表元素的排序。第三关本关任务是利用合适的方法快速创建数字列表，并能够对列表中的元素数值进行简单的统计运算。第四关我们在前三关中学习了如何处理单个列表元素和所有列表元素，在这一关中我们还将学习如何处理部分列表元素（Python 中称为切片）。

#数据挖掘 #学习 #其他

数据挖掘与机器学习：机器学习 --- 决策树

第一关本关任务：根据本节课所学知识完成本关所设置的选择题。第二关本关任务：掌握什么是信息增益，完成计算信息增益的程序设计。第三关本关任务：根据本关所学知识，完成calcInfoGainRatio函数。第四关本关任务：根据本关所学知识，完成calcInfoGainRatio函数。第五关本关任务：根据本关所学知识，完成calcGini函数。第六关本关任务：补充python代码，完成DecisionTr

#决策树 #数据挖掘 #学习 +1

推理引擎系列（六）《vLLM-Ascend 大模型推理》

本文介绍了vLLM-ascend推理引擎的整体架构与核心技术。主要内容包括：1) 社区演进与华为昇腾技术路线，强调开源生态的重要性；2) 架构解析，包含计算架构层和框架Plugin层设计；3) 核心技术如PagedAttention内存管理、ContinuousBatching优化等；4) 推理精度与性能分析方法及工具使用；5) 部署流程与常用特性。重点展示了vLLM-ascend如何通过硬件适配

#人工智能 #语言模型 #自然语言处理 +1

Triton&九齿系列（六）《DLCompiler 的高性能算子开发实践》

本文介绍了大kernel优化技术在深度学习编译器中的应用，重点分析了GroupMatmul、千问3NextAttention和DeepSeekV3Attention的优化方法。通过绑核优化实现MegaKernel，采用动态分组边界和对角线分核策略提升GroupMatmul性能。针对Attention模块提出融合Norm+Rope、rmsnorm+sigmoid等技术，避免张量变换并提升资源利用率。

#人工智能 #语言模型 #自然语言处理 +1

训练系统系列（五）《强化学习及 DeepSeek》

本文介绍了强化学习基础概念与DeepSeek架构演进。强化学习部分对比了监督学习与强化学习，详细讲解了马尔可夫决策过程、价值函数、贝尔曼方程等核心概念，以及Q-Learning、DQN、策略梯度、Actor-Critic和PPO等算法原理。DeepSeek架构部分概述了从V3到R1、V3.2的演进过程，重点介绍了MoE架构、MLA模块、RLVR训练方法和创新的DSA（稀疏注意力）技术，通过Top-

#人工智能 #机器学习

共 74 条

请选择