m0_63466673 个人主页

@m0_63466673

m0_63466673

2026-03-27 12:14:16 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

从 1-4 溃败到精准双绝平：如何用 AI Agent 预测球赛？（我们踩坑 7 次换来的体育精算方法论）

实际数据 > 理论模型 (Trend Over Theory)：如果数据表明某强队连续几场都轰入 3 球，那就别用你的“防守大巴理论”去强行克制它。实际发生的比分趋势永远比你的理论预测更真切。给软因素设立“铁天花板” (Ceiling of Soft Factors)：天气、海拔、主场哨对比赛 Base 期望的累计调整绝对不能超过 ±15%。22 个人的身价和脚下实力决定了比赛 85% 的走势。主

#人工智能 #AI

从 1-4 溃败到精准双绝平：如何用 AI Agent 预测球赛？（我们踩坑 7 次换来的体育精算方法论）

#人工智能 #AI

DeepSeek-V4-Pro 用了哪些新技术

摘要： 2026年4月，DeepSeek发布DeepSeek-V4预览版，核心突破包括1M上下文窗口和1.6T总参数，通过混合注意力架构（CSA精细检索+HCA全局压缩）显著降低长上下文推理成本（FLOPs仅V3.2的27%）。创新还涵盖：稳定性优化：mHC约束残差连接，保障超深模型训练稳定；训练效率：采用Muon优化器提升万亿级参数预训练效能；后训练整合：分领域训练专家模型，再通过on-p

#人工智能 #算法 #深度学习

终端为何再次变得重要：从 Gemini CLI 热度看 Agent 入口演变

Gemini CLI 的高热度，不只是 Google 又做了一个受关注的开源项目，也说明头部厂商都在往同一个方向靠近：谁能把模型稳定嵌进终端，谁就更有机会把 AI 从“辅助问答层”推进到“生产执行层”。把这些放在一起看，意思已经不是“你可以跟 Gemini 聊天”，而是“你可以让 Gemini 在真实工程环境里读、搜、取、改、跑、接外部系统”。模型之间当然还有差异，但对很多开发者来说，真正影响留存

#人工智能 #AI

Validation Is All You Need：验证在 Agent 落地中的核心地位

验证不是 Agent 的"附加功能"，而是 Agent 的"核心能力"。一个没有验证能力的 Agent，就像一辆没有刹车的跑车——速度越快，危险越大。而一个拥有强大验证能力的 Agent，即使推理能力有限，也能通过反复检查和修正达到可靠的输出质量。在 Agent 落地的过程中，与其追求更复杂的推理架构，不如先夯实验证基础。因为最终，用户不会为你的推理链鼓掌，他们只会为正确的结果买单。

#人工智能 #AI

DeepSeek V4 的注意力机制设计：CSA 和 HCA

DeepSeek V4针对长上下文处理提出了创新的注意力机制设计，通过交替使用压缩稀疏注意力(CSA)和重度压缩注意力(HCA)来优化推理效率。CSA先将历史KV压缩4倍，再挑选关键部分进行细粒度计算；HCA则将历史压缩128倍后直接进行全局注意力计算。这种混合设计使模型既能精准检索细节，又能获取全局概览，同时大幅降低计算成本：在100万token上下文下，推理FLOPs降至V3.2的27%，KV

#人工智能 #深度学习 #机器学习

Zero 和 Spec Kit：AI Agent 正在把“编程”推向更显式的契约时代

项目一：vercel-labs/zeroGitHub 创建时间：2026-05-15T16:55:16Z最新版本：v0.1.0，发布时间：2026-05-16T00:21:50Z项目描述：The programming language for agents项目二：github/spec-kit最新版本：v0.8.11，发布时间：2026-05-15T19:59:06Z当前数据：约 100261

#人工智能 #AI

美团LongCat-Next：用“视觉分词器“重新定义多模态模型

GPT为什么这么强？。把语言切成一个个离散的符号，然后让模型学会预测下一个。这个简单到不能再简单的想法，撑起了整个大语言模型的辉煌时代。但问题来了——语言天生就是离散的，一张图片、一段声音却不是。它们是连续的、稠密的、高维的。所以今天的多模态模型，大多采用了"打补丁"的思路：视觉编码器外挂一个语言模型，中间用适配器桥接，再加点双向注意力、3D位置编码什么的。美团LongCat团队最近开源的。

#人工智能 #神经网络 #开源

从源码拆解 Claude Code 的上下文工程

摘要 Claude Code的上下文工程系统采用分层设计，通过源码分析揭示其核心机制：分层记忆系统：采用6级优先级指令加载策略（从全局策略到本地规则），支持模块化组织和条件化注入，实现上下文动态组合。智能上下文组装：系统提示分为静态前缀和动态后缀，会话开始时自动编译生成，包含Git状态快照和分层合并的指令集。渐进式压缩策略：包含工具结果裁剪、历史片段删除和微压缩三级机制，在保持关键信息的同时

#人工智能

从 GPT-6 “Spud“ 闹剧看 AI 圈的信息不对称现象

《一场精心策划的"空气发布会"：GPT-6谣言的诞生与破灭》 4月14日，一场从未被官方确认的GPT-6发布会成了全球科技圈的焦点。这场闹剧始于3月底网上流传的所谓"GPT-6技术规格"，包括200万token窗口等详细参数，甚至精确标注了发布日期。然而当天OpenAI毫无动作，让这场"空气发布会"成为行业现象的典型案例。事件揭示了AI

#人工智能

共 51 条

请选择