
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
DeepSeek V4正式发布,具备1.6T参数、百万级上下文和全国产昇腾算力支持,性能对标GPT-5.5但成本仅为1/7。其核心创新包括混合注意力机制(CSA+HCA+SWA)降低计算开销90%,mHC流形约束优化深层网络稳定性,以及Muon优化器提升训练效率。采用两步后训练范式,先分领域优化再统一蒸馏,实现多领域均衡提升。官方测试显示,V4在编程(Codeforces评分3206)、数学(AI

这篇文章介绍了free-claude-code项目,这是一个开源代理服务器,可以拦截Claude Code的API请求并转发到免费模型服务。主要内容包括: 原理:通过本地代理服务器拦截Claude Code对Anthropic API的调用,将其重定向到NVIDIA NIM、OpenRouter或本地模型等免费替代方案。 安装配置:提供多种安装方式,包括uv工具安装和源码安装,并详细说明了三种免费

本文探讨了视频理解的核心挑战与技术演进。视频理解相比图像理解增加了时间维度,面临时序依赖、运动信息和计算爆炸三大挑战。文章分析了空间+时序的二维理解框架,并介绍了均匀采样、关键帧采样等帧采样策略。在模型演进方面,从VideoCLIP的视频检索能力,到VideoLLaMA的视频对话突破,再到LLaVA-Video的视频推理飞跃,展示了技术发展路径。最后讨论了长视频处理方案,如记忆增强机制。文章指出,

本篇进入多模态最关键的环节:怎么训练? 多模态大模型的训练不是简单地把图像和文本"喂"给模型——它需要解决三个核心问题:对齐(怎么让视觉和语言在同一个空间"对话")、指令跟随(怎么让模型学会"看图对话")、幻觉(怎么让模型"没看到就不说")。LLaVA 的训练分三个阶段:预训练(558K 图文对,只训练投影层,建立视觉到语言的基础映射)、指令微调(150K GPT-4 生成指令,训练投影层+LLM

摘要: DeepAgents系列探讨了AI代理在真实世界的四大应用场景:代码、数据、浏览器和研究。代码代理(如Devin、Claude Code)虽成熟但仍面临架构理解不足的挑战;数据代理(如ChatGPT Code Interpreter)让非程序员也能分析数据,但数据质量是关键瓶颈;浏览器代理(如OpenAI Operator)需平衡操作精度与通用性;研究代理(如Elicit)加速文献综述,但

本文探讨多模态大模型推理与部署的核心挑战——视觉Token爆炸问题。高分辨率图像产生的视觉Token(576-5184个)导致Prefill计算量暴增、KV Cache显存膨胀和批处理不均衡,使多模态推理效率仅为纯文本的1/5-1/10。优化方法包括:Token压缩(FastV/PruMerge可减少60%Token)、模型量化(GPTQ/AWQ节省60%显存)和KV Cache优化(PagedA

Claude Code 的核心优势,就是 Anthropic 提供了梯度完整的模型矩阵,从极致低成本的 Haiku,到全能均衡的 Sonnet,再到深度推理的 Opus,不同模型在不同功能场景下,Token 消耗、成本、效果有着天壤之别。选对模型,能在效果几乎不打折的前提下,让你的 Claude Code 账单直降 80%;选错模型,要么成本暴雷,要么效果拉胯。这篇文章,我就基于 Anthropi

这篇文章介绍了free-claude-code项目,这是一个开源代理服务器,可以拦截Claude Code的API请求并转发到免费模型服务。主要内容包括: 原理:通过本地代理服务器拦截Claude Code对Anthropic API的调用,将其重定向到NVIDIA NIM、OpenRouter或本地模型等免费替代方案。 安装配置:提供多种安装方式,包括uv工具安装和源码安装,并详细说明了三种免费

本文介绍了概率图模型在机器学习中的核心作用,重点讲解了贝叶斯网络和马尔可夫随机场两种图模型。文章首先阐述了图模型的价值:通过条件独立性假设大幅减少参数数量,直观表达变量间的依赖关系。随后详细解析了贝叶斯网络的有向图结构及其因子化特性,通过学生成绩预测案例展示了条件概率表的构建和推理过程。文章还对比了链式、叉式、对撞式等常见网络结构的条件独立性特点,并简要提及了无向图模型(马尔可夫随机场)和EM算法

本文系统梳理了多模态大模型的应用全景,分为三个层次:基础能力(VQA、OCR、图像描述)、进阶能力(视频理解)和行动能力(多模态Agent)。VQA作为多模态的"高考",测试模型对图像的深度理解;OCR凭借文档智能处理成为最快变现的应用;视频理解则面临时序建模和长程依赖等挑战。多模态Agent作为终极形态,实现了从"看图说话"到"看图做事"的跨越,包括Computer Use Agent、Web








