logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【DeepSeek论文精读】15. DeepSeek-V3.2:开拓开源大型语言模型新前沿

本文详细解读 DeepSeek-V3.2 技术报告和 API 使用指南。DeepSeek-V3.2 新一代开源大型语言模型在推理能力和工具调用方面实现重大突破,模型已开源并更新至官方应用,为AI社区提供高性能开源选择。

文章图片
#人工智能#语言模型#DeepSeek +1
【AIGC】商汤SenseNova大模型“超市”

「商汤」在技术交流日分享了以 “大模型+大算力” 推进 AGI(通用人工智能)发展的战略布局,公布了「商汤」的“日日新SenseNova”大模型体系,推出自然语言处理、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力。

文章图片
#AIGC#人工智能#机器学习 +1
从编程小白到博客专家:一名学习者的故事

5年前,作者作为大一新生开始在CSDN记录Python学习过程,初衷只是为解决自学中的困惑。通过持续记录,逐渐形成了系统的知识体系。2025年,作者已成长为人工智能研究生和CSDN博客专家,出版了《数字图像处理》专著。 文章分享了三点经验:1)真实记录学习过程,不跳过任何细节;2)将AIGC作为学习助手而非替代工具;3)坚持写作初心,不为榜单所累。

文章图片
#人工智能#程序人生#经验分享
【AIGC】什么是 AI 智能体

大语言模型的浪潮推动了 AI Agent 相关研究快速发展,AI Agent 是当前通往 AGI 的主要探索路线。大模型让 AI 会思考,而 Agent 让思考能落地"——这正是Deepseek等平台正在构建的下一代智能基础设施。

文章图片
#人工智能
【AGI使用教程】GPT-OSS 本地部署(1)

GPT-OSS 是 OpenAI 推出的开源 GPT 服务框架,本地部署在性能、成本和安全等方面具有显著优势。本文详细讲解 基于 Ollama+Docker+OpenWebUI 的本地化部署流程,并通过实例代码演示。

文章图片
#人工智能
【技术报告】GPT-4o 原生图像生成的应用与分析

GPT-4o 的图像生成,具有精准呈现文本、严格遵循指令、巧妙运用4o 内置知识库与对话上下文的特点。本文详细介绍 GPT-4o 的图像生成,并全文翻译官方技术报告 “Addendum to GPT-4o System Card: Native image generation”。

文章图片
#人工智能#论文阅读
【医学影像 AI】FunBench:评估多模态大语言模型的眼底影像解读能力

FunBench 视觉问答基准专为评估多模态大型语言模型(MLLMs)的眼底图像解读能力而设计,其核心特点是四级分层任务架构(模态感知、解剖结构感知、病变分析、疾病诊断)和三种针对性评估模式(基于线性探针的视觉编码器评估、知识提示的语言模型评估、整体评估),数据集涵盖 16,348 张眼底图像和 91,810 个视觉问题

文章图片
#人工智能#论文阅读
【DeepSeek论文精读】DeepSeek-R1 通过强化学习机制激励大语言模型进行推理优化

2025年 9月,DeepSeek-R1 论文以封面文章的形式登上了权威科学期刊 Nature,这是第一个在经过同行评审后发表的主流 LLM。本文详细翻译解读 【Nature封面文章】 DeepSeek-R1 通过强化学习机制激励大语言模型进行推理优化。

文章图片
#语言模型#人工智能#自然语言处理
【DeepSeek论文精读】9. DeepSeek-GRM:推理时扩展的通用奖励建模

DeepSeek-AI 发表论文 "Inference-Time Scaling for Generalist Reward Modeling(推理时扩展的通用奖励模型)",提出了一种 "自原则批判调优(SPCT)" 技术,使奖励模型在推理阶段能够动态扩展计算资源。本研究表明 “推理时扩展” 在通用 RM 中的有效性,性能超越训练时扩展。

文章图片
#人工智能#论文阅读
【智能体】零代码学习 Coze 智能体(1)快速创建智能体

借助扣子Coze提供的可视化设计与编排工具,你可以通过零代码或低代码的方式,快速搭建出基于大模型的各类 AI 项目。本文详细讲解基于 Coze 快速搭建智能体的步骤。

文章图片
#人工智能
    共 486 条
  • 1
  • 2
  • 3
  • 49
  • 请选择