
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
2025年2月28日,DeepSeek开源周迎来了第五天,也是本次活动的收官之日。自2月24日启动以来,DeepSeek团队以每天一个开源项目的节奏,陆续向全球开发者展示了他们在人工智能基础设施领域的最新成果。今天,他们发布了Fire-Flyer File System(简称3FS)和配套的数据处理框架Smallpond。这两项工具专注于解决AI训练与推理中的数据访问和处理难题,以卓越的性能和简洁

DeepSeek,一个致力于推动通用人工智能(AGI)发展的小型团队,自2025年2月24日起,通过每天发布一个开源仓库的方式,向AI社区分享他们的技术进展。这种举措并非为了炫耀,而是作为一群开发者,以透明和协作的精神,展示他们在构建在线服务过程中的点滴积累。继前三天的精彩发布后,第四天,DeepSeek聚焦于优化并行策略,发布了三项关键组件,进一步提升大规模AI模型在训练和推理中的效率。

今天是DeepSeek开源周的第三天,这个以“小而美”著称的团队再次放出大招——开源FP8通用矩阵乘法库DeepGEMM!这个库不仅以1350+ TFLOPS的FP8计算性能刷新行业标杆,更以仅300行核心代码的极简设计惊艳开发者社区。无论你是AI研究员还是CUDA编程爱好者,这篇文章都将带你一览这项“大道至简”的技术革新!

DeepEP应运而生,专为**专家并行(EP)**场景优化,支持千亿参数级MoE模型的高效运行,例如DeepSeek-V3这类671B参数的“巨无霸”。——全球首个专为混合专家模型(MoE)设计的开源通信库!这一工具将彻底改变MoE模型的分布式训练与推理效率,为AI开发者提供前所未有的性能优化方案。传统通信库(如NCCL)难以满足MoE特有的全对全(All-to-All)数据交换需求,导致大规模模

2025 年 2 月 24 日,DeepSeek 启动“开源周”,首日发布 FlashMLA,这是一个高效的 MLA 解码内核,专为 NVIDIA Hopper 架构 GPU 优化,旨在提升 LLM 的推理性能(DeepSeek 开源周首日)。,彻底告别传统连续内存分配导致的显存碎片。,将键值矩阵压缩至原体积的1/4,实现93.3%的KV缓存量削减,让万token级长文档分析不再是土豪企业的专属。

文章目录一. 配置详情二. 环境准备三.安装kubeadm,kubectl,kubelet四.部署Kubernetes Master五. Node节点加入集群之前在centos os7搭建过单机版k8s 搭建单机版k8s(搭建过程中,不清楚的地方可以借鉴这篇博客,比较详细),最近工作比较轻松,于是在虚拟机上搭建了k8s集群,开始k8s的学习,特此记录搭建过程 .一. 配置详情Virtual Box
新公司的开发模式是远程开发,将代码环境部署到虚拟机中,然后使用vscode远程连接进行开发,使用下来感觉也挺方便的,特此记录文章目录1. 配置免密登录2.服务器安装vscode-server3. vscode安装插件本机 windows10远程开发机 ubuntu18.041. 配置免密登录windows:执行ssh-keygen,一路按回车,在用户目录下生成.ssh目录ubuntu:同样执行ss
文章目录一、安装二、图片裁剪三、将截图框回显到原图上由于项目需要,需要做图片裁剪。之前的项目已经由cropper.js实现过,因为这次使用的是vue,所以采用了vue-cropper这个组件,使用起来很简单,但是坑也很多。一、安装npm install vue-croppermain.jsimport VueCropper from 'vue-cropper'Vue.use(VueCropper)
文章目录功能实现1.点击搜索框,显示列表,点击其它地方搜索列表消失.2.点击enter键,也可以进行搜索3.点击搜索框不输入搜索内容,显示热门搜索和历史搜索。点击搜索框输入搜索内容,直接显示搜索列表4.将历史搜索内容存储到LocalStorage.5.删除历史记录搜索框组件源码功能实现1.点击搜索框,显示列表,点击其它地方搜索列表消失.在input组件上监听focus与blur事件,设置i...
文章目录一. 配置详情二. 环境准备三.安装kubeadm,kubectl,kubelet四.部署Kubernetes Master五. Node节点加入集群之前在centos os7搭建过单机版k8s 搭建单机版k8s(搭建过程中,不清楚的地方可以借鉴这篇博客,比较详细),最近工作比较轻松,于是在虚拟机上搭建了k8s集群,开始k8s的学习,特此记录搭建过程 .一. 配置详情Virtual Box