logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【DeepSeek论文精读】6. DeepSeek R1:通过强化学习激发大语言模型的推理能力

本文由 youcans@xidian 对论文 DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning 进行摘编和翻译。该论文版权属于原文期刊和作者,本译文只供研究学习使用。

文章图片
#深度学习#人工智能
【技术报告】谷歌开源多模态大模型 Gemma-3

2025年 3月1,谷歌推出最新多模态大模型 Gemma-3。这是一组轻量级、最先进的开源模型,可以直接在手机、PC、工作站上快速运行。本文详细介绍 Gemma-3 技术报告。

文章图片
#人工智能#多模态
【DeepSeek论文精读】17. 通过可扩展查找的条件记忆:大语言模型稀疏化的新维度

DeepSeek团队提出Engram条件记忆模块,通过可扩展查找机制解决大语言模型知识检索效率低的问题。Engram结合N-gram嵌入的O(1)静态检索与MoE动态计算,利用哈希压缩和上下文感知门控优化性能。

文章图片
#语言模型#人工智能#论文阅读
【跟我学 AI 编程】(3)QoderCN(通义灵码)快速指南

本文介绍阿里云推出的 Qoder CN(原通义灵码)的功能特点与使用方法。Qoder CN支持代码补全、智能问答、文件编辑和智能体模式等核心功能,兼容主流IDE和200多种编程语言。文章详细说明了在VS Code和JetBrains系列IDE中的安装步骤,并展示了代码补全的具体应用场景,包括行级补全、函数级补全和注释生成代码等功能。此外还介绍了面向高校学生的免费使用计划,帮助开发者更高效地完成编码

文章图片
#人工智能
【跟我学 AI 编程】(5) Claude Code 快速指南

本文为Claude Code入门指南,明确其终端AI编程助手定位,详解多场景安装、国内用户适配及登录方法,重点介绍第三方模型(豆包)接入技巧,以及核心架构、交互模式等必备知识,助力读者快速掌握终端端AI辅助编程能力,下一篇将讲解其与VS Code、PyCharm的对接方法。

文章图片
#人工智能
【跟我学 AI 编程】(5) Claude Code 快速指南

本文为Claude Code入门指南,明确其终端AI编程助手定位,详解多场景安装、国内用户适配及登录方法,重点介绍第三方模型(豆包)接入技巧,以及核心架构、交互模式等必备知识,助力读者快速掌握终端端AI辅助编程能力,下一篇将讲解其与VS Code、PyCharm的对接方法。

文章图片
#人工智能
【youcans论文精读】基于 DINOv3 的实时目标检测

本文提出DEIMv2实时目标检测器,创新性地融合DINOv3特征与空间调优适配器(STA),构建覆盖GPU、边缘及移动设备的8种模型尺寸。

文章图片
#目标检测#人工智能#计算机视觉 +1
【跟我学YOLO】YOLO26(2)实时目标检测的关键架构改进与性能基准测试

本文重点解析YOLO26的架构创新,包括:端到端的免非极大值抑制(NMS-free)推理机制、为简化导出流程而移除的分布焦点损失(DFL)、提升稳定性与小目标检测能力的渐进损失(ProgLoss)与小目标感知标签分配(STAL)策略,以及受大语言模型训练启发采用的MuSGD优化器。

文章图片
#目标检测#人工智能#架构 +1
【医学影像 AI】基于 AI 的远程筛查 ROP 效果评价

本研究首次在真实世界的ROP远程医疗筛查项目中,评估了基于深度学习的血管严重程度评分系统的诊断性能。证明 AI 生成的血管严重程度评分与国际ROP分类标准(分区、分期、Plus病变)显著相关,可作为标准化筛查工具。

文章图片
#人工智能#健康医疗#计算机视觉
【DeepSeek论文精读】19. 多模态:用视觉基元思考

DeepSeek团队提出了一种创新的多模态推理框架“用视觉基元思考”(Thinking with Visual Primitives),通过将点和边界框作为最小思维单元嵌入推理过程,解决传统多模态大模型(MLLMs)在空间推理任务中的指代鸿沟问题。该模型基于高效的DeepSeek-V4-Flash架构,结合自研DeepSeek-ViT,实现了7056倍的视觉令牌压缩,显著提升了推理效率。

文章图片
#人工智能
    共 517 条
  • 1
  • 2
  • 3
  • 52
  • 请选择