logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

DeepSeek-MoE的发展路线v1-->v3

moe的第一代、第二代、第三代,参数量在逐步增加,优化的粒度被逐步细化。一直被坚持的,一个是共享的一个专家。第二是细粒度切分的一个专家。在第三代里边被保留的:第一个是device limited routing,一个token它最多能被多少个device做处理,这个做了一个限制。第二个是无损的负载均衡和序列的一个负载均衡。这两块是替代了之前的专家级别的均衡,设备级别的均衡以及通信。然后同时他也丢弃

文章图片
DeepSeek有什么技术创新?为什么这么火

本人认为本人无晦涩难懂的知识,加入《人人都要了解DeepSeek》系列--1。

文章图片
【python】迭代器和生成器的区别和联系

一.迭代器通过iter()方法获得了list的迭代器对象,然后就可以通过next()方法来访问list中的元素了。当容器中没有可访问的元素后,next()方法将会抛出一个StopIteration异常终止迭代器。#encoding=utf-9li=[5,6,7]it=iter(li)print itprint it.next()print it.next()print it.next(...

利用Oracle VM VirtualBox搭建单master节点的k8s集群

这个步骤是我一边搭建,一边查资料,一边记录的,希望会对正在查找资料的你有帮助。一.搭建环境:Oracle VM VirtualBox创建3个虚机,1个充当master节点,2个充当node节点操作系统镜像:CentOS-7-x86_64-DVD-2009.iso硬件配置:2GB +,2 个 CPU +集群中所有机器之间网络互通可以访问外网,需要拉取镜像禁止 swap 分区 (在第二部分系统初始化中

文章图片
#kubernetes
python3实现一个kafka的consumer和producer

kafka大致流程图如下:生产者:将字符串发送给 Kafka消费者: 获取数据并展示在终端窗口中一.用python3实现一个producer(填你们自己需要的信息就好啦)import jsonfrom kafka import KafkaProducerfrom kafka.errors import KafkaErrorclass KafkaClie...

pipeline中实现gitlab push代码后自动触发Jenkinsjob

前提:jenkins已经安装gitlab plugin 插件,且版本大于等于1.5.12jenkins插件各个版本的链接:http://updates.jenkins-ci.org/download/plugins/gitlab-plugin/通过upload plugin即可安装指定版本一.在Jenkinsfile文件的triggers下增加一个触发器gitlab(trig...

【python】从一个文件中,查找出现次数最多的5个词

#coding = utf-8def find_word(filename):resultdict={}with open(filename)as fp:for i in fp:print iwordlist=i.split()for j in wordlist:if not resultdict.has_key(j):resultd...

到底了