logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

产品背景知识:大模型的参数

在人工智能的前沿领域,大模型正以其强大的能力重塑着我们对智能的认知。而大模型参数,作为模型的“内部零件”,则是理解这一强大技术的关键所在。这些参数各有独特用途,共同支撑起大模型的智能架构。

文章图片
#人工智能
AI芯片需要的特性(内附大量知识点)

AI芯片需具备对多样神经网络模型架构的灵活支持和高效执行特有计算逻辑的能力,以适应不同的应用需求。AI芯片应支持模型压缩算法,如量化和剪枝,以提高模型在终端部署时的推理性能,并实现软件算法与硬件执行的高效协同。AI芯片设计应考虑轻量化网络结构,支持更复杂的卷积运算和数据逻辑,以适应算力和带宽受限的场景。AI芯片需支持大模型的分布式并行策略,包括高效的片上网络接口和总线设计,以及大内存容量和高速互联

文章图片
#人工智能
网络存储S3 与 MinIO对比

例如 Amazon S3、MinIO,将数据作为“对象”(Object)存储,每个对象包含数据、元数据和唯一标识符(如 URI),适合海量非结构化数据(图片、视频、日志等)。Amazon S3(Simple Storage Service)是 AWS 在 2006 年推出的首个公有云对象存储服务,定义了行业标准的对象存储 API。MinIO 是 2014 年发布的开源对象存储系统,完全兼容 Ama

文章图片
#网络
GGUF、Safetensors、ONNX三种格式

参考:https://github.com/karminski/one-small-step/blob/main/20250122-how-to-run-gguf-LLM-model/how-to-run-gguf-LLM-model.md。总而言之,GGUF 是一种重要的 LLM 文件格式,它通过提高存储效率、加载速度和兼容性,简化了 LLM 的使用和部署,并有望成为未来大模型文件标准格式之一。

文章图片
#人工智能
分布式——分布式一致性算法(共识算法)

Paxos算法是分布式系统达成一致性的基础协议,由Leslie Lamport提出。它通过两阶段协议(Prepare和Accept)确保在异步非拜占庭环境下,即使存在节点故障或消息丢失,多数派节点也能对提案达成共识。算法包含三种角色:Proposer提出提案,Acceptor表决提案,Learner学习选定值。关键特性包括安全性(唯一值被选定)和活性(最终必达一致)。Raft算法则进一步优化了共识

#算法#分布式#共识算法
计算机网络——Nginx负载均衡配置指南:四层与七层负载均衡实践

四层负载均衡:适合低延迟、高性能要求的TCP/UDP服务七层负载均衡:适合需要应用层智能路由的HTTP服务安全配置:必须重视隐私保护和访问控制性能优化:需要根据实际业务特点进行针对性调优实际部署时应结合业务需求、流量特点和系统资源情况,选择合适的负载均衡策略,并通过持续监控不断优化配置。

文章图片
#计算机网络#nginx#负载均衡
浅析容器运行时

容器运行时是管理容器生命周期的软件组件,主要分为三类:低级运行时(如runc)仅负责进程隔离和资源限制,依赖内核Namespace/CGroup;高级运行时(如Containerd)在此基础上整合镜像管理、网络存储等功能,支持OCI规范;沙盒/虚拟化运行时(如Kata)通过轻量级虚拟化增强隔离性,适合高安全场景。三类运行时在功能复杂度、隔离性和性能开销上存在显著差异,适用于不同场景。低级运行时轻量

#容器
XJTUSE 数学建模第二次作业

分别映射到1-26的方式,将原文字母映射为数字,并且将得到的数字序列根据密钥的维度排列成明文矩阵。做矩阵模乘法,即现将两矩阵相乘,再将所得结果每个元素均除N取余,加密字符集仅涉及26个字母。加密解密只考虑字母a-z,并不包含其他符号,将计算得到的矩阵的每一个元素模2。计算给定的密钥矩阵K KK的行列式,然后将所得行列式的值除以N取余。让密文乘上一步骤中解得的逆矩阵,就可以得到解密的明文。第一步是将

文章图片
    共 19 条
  • 1
  • 2
  • 请选择