logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

文档的特征分析

文档的特征分析涉及设计、内存优化和底层字符数据处理等多个层面。下面这个表格帮你快速梳理这些核心特征类别、对应的方法与算法。特征类别核心目标关键方法与算法示例​保证视觉一致性、布局美观、格式规范自动化规则检查、基于深度学习的布局分析(如 DocLayout-YOLO)、多模态预训练模型(如 LayoutLM)​高效管理大量相似对象,节省内存享元模式(Flyweight Pattern)​从字符序列或

#网络
【人工智能】Transformer训练中如何进行梯度计算

在Transformer模型的训练中,设计梯度就算主要是指理解和利用自动微分,并针对Transformer的结构特点进行关键设计,使梯度能够​。Transformer的核心组件包括嵌入层、位置编码、多头注意力和FFN,其中自注意力是难点。Query、Key、Value矩阵的梯度如何传递,特别是softmax和缩放因子的影响。​ 手动“编写”基础梯度计算的过程在现代深度学习框架中已经被高度自动化封装

#人工智能#transformer#深度学习
【人工智能】Transformer训练中如何进行梯度计算

在Transformer模型的训练中,设计梯度就算主要是指理解和利用自动微分,并针对Transformer的结构特点进行关键设计,使梯度能够​。Transformer的核心组件包括嵌入层、位置编码、多头注意力和FFN,其中自注意力是难点。Query、Key、Value矩阵的梯度如何传递,特别是softmax和缩放因子的影响。​ 手动“编写”基础梯度计算的过程在现代深度学习框架中已经被高度自动化封装

#人工智能#transformer#深度学习
【人工智能智算中心】整体设计

​商业成功关键​技术​:通过 ​​“3D混合并行+RoCEv2优化”​​ 实现千卡线性度>90%​产品​:推出 ​​“训练即服务(TaaS)”​​ 按MFU(Model FLOPs Utilization)计费​生态​:构建 ​​“模型市场+开发者社区”​​ 形成闭环生态​创新计费公式​TaaS计费​ =\text{GPU小时} \times \text{MFU系数} \times \text{单

#人工智能
【人工智能的智算网络】大模型训练/推理网络技术篇:RDMA

​短距离缺陷​:多路径带宽竞争可能导致吞吐量波动,需动态负载均衡算法(如基于RTT的加权轮询)。​长距离缺陷​:RDMA对丢包敏感,需结合前向纠错与冗余传输(如Reed-Solomon编码)。​MOE并行挑战​:动态路由引入的计算-通信依赖复杂性,需细粒度流水线调度(如COMET系统的Token级重叠技术)。通过上述优化,可在千亿级参数模型训练中实现30%以上的MFU提升(如华为昇腾集群),并将通

文章图片
#人工智能#网络
【人工智能】机器学习

机器学习以​​数据驱动​​为核心,通过监督、无监督、强化学习等范式解决现实问题,但其效能受制于数据质量、算力与场景适配性。在医疗、工业等数据密集领域优势显著,而在高确定性或创造性任务中传统方法更优。未来需在算法可解释性、轻量化部署及伦理框架上持续突破,以实现“人类-AI”协同进化。

#人工智能#机器学习
互联网CDN的降本增效

1.AI/ML的全面渗透:从缓存、调度到容量预测,机器学习正在成为优化平台的核心大脑,实现从“反应式”到“预测式”的转变。2.边缘计算:将计算能力下沉到更靠近用户的CDN节点,对内容进行预处理、个性化组装,减少回源流量,降低中心云压力。3.软硬件协同:使用智能网卡(SmartNIC)、FPGA等硬件卸载消耗CPU的任务(如压缩、加密、转发),释放服务器算力,间接降本。4.零信任与安全成本优化:DD

#前端
智算网络中的数学方法

根据业务负载特征(计算密集型或通信密集型)选择最优扩展策略,需结合性能瓶颈、成本效益和系统架构综合决策。​:视频转码服务采用RTX 4090集群垂直扩展,单节点转码效率提升4倍,延迟降低至20ms。​:电商秒杀系统通过水平扩展至1000节点 + Redis缓存,QPS从1k提升至50k。​:通过提升单节点资源配置(如CPU核数、内存容量、GPU算力)增强系统性能。​:通过增加节点数量 n 提升系统

#网络#云计算#分布式
【网络】BFD(双向转发检测)和SBFD(无缝双向转发检测)

BFD(双向转发检测)和SBFD(无缝双向转发检测)作为网络可靠性保障的核心协议,其底层实现机制、软硬件分工、数学建模及混合部署策略是构建高可用网络的关键。以下从技术实现层面对比分析,并给出混合部署的优先级设计策略。

#网络
指数加权移动平均(EWMA)算法

​​核心规律​​:α与敏感度呈正相关,与抗噪性呈负相关;小α适慢漂移,大α适快突变。​​实施步骤​​:① ​​评估数据特性​​:检查连续性、噪声类型(系统/随机)及样本频率;② ​​匹配场景需求​​:根据偏移速度与容忍度查表选择α初值;③ ​​动态验证调优​​:通过ARL或MRL(中位运行长度)指标测试α性能,结合机器学习迭代优化。​​高级方向​​:在数字孪生系统中嵌入EWMA,实现虚拟与现实控制

#算法#人工智能#机器学习
    共 103 条
  • 1
  • 2
  • 3
  • 11
  • 请选择