logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

EMR重磅发布智能运维诊断系统(EMR Doctor)——开源大数据平台运维利器

E-MapReduce 推出面向开源大数据集群的智能运维诊断系统 E-MapReduce Doctor,有效提升大数据集群运维效率,辅助 EMR 用户完善集群监控体系。

#大数据#运维#开源
MaxCompute x Dataworks × DeepSeek,实现使用自定义数据集微调DeepSeek-R1蒸馏模型

本文以MaxCompute+Dataworks+PAI为基础,快速微调DeepSeek-R1蒸馏模型。

文章图片
#人工智能
【ASPLOS2024】RECom:通过编译器技术加速推荐模型推理,论文中选并获得荣誉奖项!

关于推荐模型自动编译优化的论文《RECom: A Compiler Approach to Accelerate Recommendation Model Inference with Massive Embedding Columns》在系统领域顶会ASPLOS 2024上中选并进行了展示,并被授予了Distinguished Artifact Award 荣誉

文章图片
#人工智能
云上玩转DeepSeek系列之四:DeepSeek R1 蒸馏和微调训练最佳实践

本文将为您带来“DeepSeek R1+Qwen 大模型蒸馏和微调训练”最佳实践。阿里云 PAI 平台提供了围绕 DeepSeek 模型的最佳实践,涵盖快速部署、应用搭建、蒸馏和微调等环节,帮助开发者高效利用计算资源,使用 Model Gallery 功能,轻松完成部署与微调任务。

文章图片
#人工智能
使用PAI-DSW搭建基于LangChain的检索知识库问答机器人

LangChain是一个开源的框架,可以让AI开发人员将像GPT-4这样的大语言模型(LLM)和外部数据结合起来,从而在尽可能少消耗计算资源的情况下,获得更好的性能和效果。在本教程中,您将学习如何在阿里云交互式建模(PAI-DSW)中,基于LangChain的检索知识库实现知识问答。文件中,您可以直接看到教程文本,您可以在教程文件中直接运行对应的步骤的命令,当成功运行结束一个步骤命令后,再顺次运行

加速 AI 应用落地!DataWorks 数据治理中心全新升级为数据资产治理

DataWorks 全新升级为数据资产治理平台,强调从业务视角进行数据资产管理,引入标签体系组织数据资产,简化数据管理与分析。新增 Data+AI 全链路数据血缘追踪功能,覆盖数据从采集到AI模型训练全过程,促进跨部门协作。

文章图片
#人工智能#大数据#数据分析
阿里云智能大数据演进

本文根据7月24日飞天发布时刻产品发布会、7月5日DataFunCon2024·北京站:大数据·大模型.双核时代实录整理而成

文章图片
#阿里云#大数据#云计算
【云栖2023】王峰:开源大数据平台3.0技术解读

演讲嘉宾:王峰 | 阿里云研究员,阿里云计算平台事业部开源大数据平台负责人。演讲主题:开源大数据平台3.0技术解读

文章图片
#开源#大数据
AI大模型时代下运维开发探索第二篇:基于大模型(LLM)的数据仓库

一份需求查询SQL,利用LLM生成两份代码,一份用于Pull:直接查询返回结果,预查询调试用;一份用于Push:构建消费链路进实时数仓。避免ETL过程的过度加工:按需加字段,不会加工太多用不到字段浪费计算、浪费存储。降低使用者维护ETL加工过程成本:虽然Flink SQL的可维护性已经很好了,但是面向计算过程的SQL编写方式还是让很多用户不适应。如果直接用查询SQL来进行自动生成,就大大降低了维护

文章图片
#原型模式
【解决方案】DistilQwen2.5-R1蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践

DistilQwen2.5-R1 系列以少量来自 DeepSeek-R1 的思维链蒸馏数据为基础,通过一系列创新的蒸馏策略,有效强化了小模型的深度思考能力。实验评估结果显示,DistilQwen2.5-R1系列中的多种小规模模型在各项基准测试中表现优异,性能显著超越了其他开源蒸馏模型。

文章图片
#人工智能#深度学习
    共 56 条
  • 1
  • 2
  • 3
  • 6
  • 请选择