logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

人工智能篇---短视频平台的推荐算法

短视频平台的推荐算法是一套复杂的多阶段过滤系统,通过"召回-粗排-精排-混排"的漏斗流程,从海量内容中精准匹配用户兴趣。系统采用多模型协同策略:召回阶段通过兴趣、向量、热度和社交等多路并行获取候选集;精排阶段运用深度学习分析用户行为,通过多目标学习和大模型(如RankMixer)预测互动概率。这套工程体系还面临实时性、信息茧房等挑战,需要结合人工审核和多样化推荐来优化用户体验。

文章图片
#人工智能#推荐算法#算法
深度学习篇---全局平均池化(Global Average Pooling, GAP)

全局平均池化(GAP)是深度学习中一种高效的特征聚合方法,通过计算每个通道所有空间位置的平均值,将三维特征图压缩为一维向量。相比传统展平+全连接层,GAP能减少98%参数量,增强模型泛化能力,并支持任意输入尺寸。其核心思想是将每个通道视为特定语义特征检测器,通过均值反映特征整体强度。GAP还具有内置正则化效果和良好的可解释性,支持类激活图可视化,成为ResNet等现代CNN架构的标准组件。该技术特

文章图片
#深度学习#人工智能
FPGA篇---为什么 Vivado 需要许可证

Vivado采用许可证制度是AMD商业策略与技术保护的综合体现。通过版本分层(免费WebPACK到付费企业版)实现差异化定价,回收巨额研发成本;技术层面,许可证控制器件支持与高级功能(如HLS、AI引擎)的使用权限;同时通过教育免费授权培养用户生态。这种模式既保障了FPGA工具链的持续创新,又维持了商业可持续性,与EDA行业标准一致。不同用户可根据需求选择对应授权方案:学生用免费版学习,企业购买高

文章图片
#fpga开发
深度学习篇---ROC与AUC指标

ROC曲线是评估二分类模型性能的重要工具,通过分析不同阈值下的真正率(TPR)和假正率(FPR)来绘制曲线。其核心优势包括不受类别分布影响、全面反映模型性能、便于比较等,尤其适合不平衡数据集。AUC(曲线下面积)量化模型性能,0.5表示随机猜测,1表示完美分类。ROC曲线广泛应用于医学诊断、信用评分等领域,但需注意其对阈值不敏感、忽略概率校准等局限。实际应用中应结合业务需求选择最优阈值,并辅以其他

文章图片
#深度学习#人工智能
信息论与编码篇---切比雪夫距离

切比雪夫距离是一种关注最大偏差的距离度量方法,源于国际象棋中国王的移动规则。它计算各维度绝对差值的最大值,在质量控制、实时系统、仓库管理等领域有独特应用。相比欧氏距离和曼哈顿距离,切比雪夫距离更关注最坏情况,其等高线呈正方形。典型应用场景包括棋盘游戏、自动化仓储调度、图像处理等,特别适合衡量多维度系统中的瓶颈因素。这种距离度量方式为同时运动的多维度系统提供了有效的评估工具。

文章图片
#算法#机器学习#人工智能
具身智能篇---LLaVA (Large Language-and-Vision Assistant)

LLaVA是由威斯康星大学提出的开源多模态大模型,通过将CLIP视觉编码器与大语言模型结合,赋予AI视觉理解和对话能力。其核心架构包含视觉编码器、语言模型和轻量级投影层,采用两阶段训练策略实现高效学习。从LLaVA1.5到LLaVA-NeXT的演进中,模型支持高分辨率图像、视频理解和OCR增强等功能,在具身智能领域实现开放词汇任务规划、视觉问答辅助决策等应用。

文章图片
具身智能篇---VLA(Vision-Language-Action)

VLA模型是具身智能领域的突破性技术,通过端到端多模态架构实现视觉、语言到动作的直接映射。它将机器人动作离散化为Token,采用Transformer架构融合视觉和语言信息,具备零样本泛化和常识推理能力。代表性模型如RT-2、Octo等展示了语义泛化和多任务统一优势,但仍面临推理延迟、数据需求和安全挑战。未来将向多模态扩展、结合世界模型、优化效率等方向发展,是实现通用机器人的核心技术路径。

文章图片
具身智能篇---OpenVLA (Open-Source Vision-Language-Action Model)

OpenVLA是首个开源的70亿参数视觉-语言-动作基础模型,由斯坦福、伯克利等机构联合推出。它通过端到端架构将视觉感知、语言理解和机器人控制融合,直接输出动作指令,解决了传统机器人策略的泛化性差、数据封闭和模块割裂问题。模型基于Llama2/3改造,创新性地将连续动作离散化为Token,通过两阶段训练实现知识迁移。其开源特性推动了具身智能社区共建,虽存在推理延迟和精度等挑战,但标志着通用机器人操

文章图片
上位机操作篇---NVIDIA GPU + PyTorch GPU版本配置

本文详细介绍了PyTorch GPU版本的完整配置流程,包含四个核心步骤:驱动检查、CUDA安装、cuDNN配置和PyTorch安装。首先需确认NVIDIA显卡支持并更新驱动版本,然后安装对应版本的CUDA Toolkit和可选但推荐的cuDNN加速库。文章提供了Windows和Linux系统的具体安装方法,并推荐使用虚拟环境隔离依赖。最后通过验证脚本检查GPU是否可用,并给出常见问题解决方案。配

文章图片
#深度学习#人工智能
上位机知识篇---再看版本依赖

软件版本不匹配的本质是依赖模块间的"契约"被破坏。当某个模块更新后,其他依赖模块无法适应其API、ABI或行为语义的变化,导致系统异常。问题表现为编译错误、链接失败或运行时崩溃,根源在于生态系统复杂性、持续迭代和环境差异。解决方案需遵循"锁定环境,隔离依赖"原则:1)明确声明依赖版本;2)使用虚拟环境或容器隔离;3)采用智能包管理器;4)锁定精确版本;5)C

文章图片
    共 549 条
  • 1
  • 2
  • 3
  • 55
  • 请选择