登录社区云,与社区用户共同成长
邀请您加入社区
HyperFrames的核心价值在于构建了一套完整的视频生产协议,将视频生成分解为可验证的三层流程:复用入口(初始化项目与素材)、创作主链(时间约束的HTML描述)和验证回路(结构化检查与预览)。系统通过seek协议确保帧级时间精度,要求所有动画必须支持任意时间点的状态查询,并提供了完整的质量门禁(lint/validate/inspect)来保证输出可靠性。最关键的是,它通过严格的技能划分(sk
同一个问题,同一个模型,换一个时间再问一次,答案还一样吗?本次测试基于B-009中“技术锁定”和“模糊态”两种问法,对豆包和DeepSeek进行了跨批次回测,并与B-009基线数据对比,观察模型行为的一致性。
DeepSeek推出DSpark系统实现大模型高效生成,通过半自回归架构和置信度调度验证两大创新显著提升推理速度。系统采用并行主干DFlash生成草稿,结合轻量顺序头注入token依赖,缓解传统推测解码中草稿质量差的问题;同时引入硬件感知调度器动态裁剪低置信后缀,避免无效验证拖累系统。线上实测显示,V4系列模型生成速度提升60%-85%,吞吐量提高51%-661%,在维持无损解码的前提下将服务性能
GPT-Rosalind是OpenAI于2026年4月推出的领域专用前沿推理模型,旨在加速生命科学研究、药物研发与转化医学进程。模型以DNA结构研究先驱Rosalind Franklin命名,针对多步骤科研工作流优化,在化学、蛋白质工程与基因组学领域具备深度理解能力。该模型目前通过可信访问计划,以ChatGPT、Codex及API形式提供研究预览版;配套免费的生命科学Codex插件,可对接50余个
1. 大模型发布进入"密集期" — 短短两周内,Anthropic发布Claude Fable 5、谷歌推出DiffusionGemma、月之暗面更新Kimi K2.7 Code、智谱发布GLM-5.2,旧排行榜刚确立就被新发布打乱,竞争白热化。2. AI Agent生态加速成熟 — 从BrowserBC的"克隆人类点击"到TRAE Work Design的"需求到代码全搞定",AI Agent正
大语言模型(Large Language Model, LLM)是近年来人工智能领域最具突破性的技术之一。从 GPT 到 Claude,从 LLaMA 到 Qwen,这些模型在自然语言理解和生成方面展现出了惊人的能力。本文将深入探讨 LLM 的核心技术原理,并结合实际工程经验,帮助读者全面理解这一技术。
Codex的玩法更接近“自动化流水线+目标驱动+多个子Agent”的组合,在一些开发者的实际体验中,能看到最多8个Agent同时跑在各自的云端沙箱里,各干各的活,最后把结果汇总回来。如果说Harness解决的是“AI能不能在真实环境里干活”的问题,那loop解决的就是“AI能不能在这个环境里持续干活、自己推进任务、不需要人一步步盯着”的问题。我的工作,就是写循环。用一个模型(或者子Agent)负责
我们推出DeepSeek-V4系列的预览版,其中包括两个强大的混合专家 (MoE) 语言模型——DeepSeek -V4-Pro(1.6T 参数,已激活 49B)和DeepSeek-V4-Flash (284B 参数,已激活 13B)——两者均支持一百万个标记的上下文长度。混合注意力架构:我们设计了一种混合注意力机制,结合了压缩稀疏注意力(CSA)和高度压缩注意力(HCA),以显著提高长上下文效率
如果说 2017-2023 大模型的关键词是(参数和数据越多越好),那 2024-2026 就出现了一个全新关键词——Test-Time Scaling(推理时扩展)。这是和 MoE 并列的,过去三年大模型最重要的两大架构创新。让模型在回答前,先「思考很久」。简单一句话背后,是 OpenAI o1(2024.09)、DeepSeek R1(2025.01)、Claude 4 Thinking、Ge
因为它做了之前所有模型都没做到的一件事:把AI的能力包装成了一个普通人直接能用的产品。你不需要懂技术,不需要学编程,只需要像跟朋友聊天一样打字,AI就能回答问题、写文章、写代码、翻译、总结、分析。长期以来,AI对于大众,都只是科幻电影里的一时惊艳,或者新闻里"又双叒叕取得突破"的过目即忘。ChatGPT的出现,让每个普通人,真切地感受到了AI的存在。只需要像和普通人对话一样,问AI问题、让AI写文
GLM虽然也支持2M token上下文,但在超长代码场景下,细节召回率、逻辑连贯性稍弱,处理多模块联动的重构任务时,更容易出现上下文遗漏、变量引用错误。代表测试集:SWE-bench Verified(真实GitHub仓库Bug修复,最贴近实际开发的基准) 这是行业公认最有参考价值的编程能力测试,模型需要理解完整项目代码、定位问题、生成可通过全部测试的补丁,最能反映工程级编程能力。换算下来,GLM
Claude Agent Skills 的快速增长引发了一个核心问题:如何有效地利用、管理和扩展智能体的 Skill 生态系统?本文提出了**AgentSkillOS**,这是首个用于技能选择、编排和生态系统级管理的原则性框架。AgentSkillOS 包含两个阶段:(i)**Manage Skills**,通过节点级递归分类将技能组织成能力树,以实现高效发现;(ii)**Solve Tasks*
摘要:本文分享了作者如何借助AI工具独立开发一款专为粮油快消批发行业设计的轻量化进销存SaaS系统。针对行业痛点(开单效率低、设备限制、数据模糊、行业适配差),作者通过AI完成了产品设计、UI界面、后端逻辑、移动端开发等全流程开发,重点实现了AI语音开单、全终端打印等核心功能。相比传统外包开发(3万元起),AI辅助开发成本不足千元,最终产品以99元/年定价切入垂直市场。关键经验:聚焦细分领域痛点、
我们提出了 **Qwen3-Omni**,这是一个单一的多模态模型,首次实现了在文本、图像、音频和视频四方面均保持最先进的性能,且性能与单模态模型相比没有任何下降。Qwen3-Omni 的性能与 Qwen 系列中同等规模的单模态模型相当,尤其在音频任务上表现卓越。在 36 项音频和视听基准测试中,Qwen3-Omni 在 32 项测试中达到了开源领域最先进水平 (SOTA),并在 22 项测试中达
router skill的核心功能是管理复杂技能库的认知负载。它通过分层路由机制,将技能库划分为:主线流程(idea→ship标准开发路径)、并入入口(如问题分类)、独立技能和前置条件四类。该设计体现了三个关键思想:(1)严格控制上下文卫生,规定何时保留完整上下文(如设计阶段),何时重置(如具体实现);(2)明确区分handoff(跨会话迁移)和compact(会话内压缩)两种上下文管理方式;(3
企业级 Agent 产品不是"大模型 + 工具调用"的简单叠加,而是一个需要在智能性与确定性之间寻找平衡的工程系统。分层解耦架构通过感知、决策、执行、审计四层分离,将 LLM 的不确定性约束在可控范围内,同时保留了语义推理的核心能力。路由控制器是架构的关键枢纽,它决定了哪些任务需要"智能",哪些只需要"确定"。Token 成本占比(目标 < 30%)、确定性任务命中率(目标 > 50%)、审计覆盖
轻量化 Agent 设计的本质是回归第一性原理:Agent 的核心就是"LLM + 工具 + 循环"。任何超出这个核心的抽象,都应该由开发者按需引入,而非框架强制捆绑。Tool-Loop 架构用不到 200 行代码实现了 Agent 的完整运行时,零外部依赖,调试路径清晰,性能开销可控。落地路线建议:第一步,用本文的 Tool-Loop 核心实现替换项目中臃肿的 Agent 框架依赖,先跑通单工具
开源AI技术栈五层架构解析:从大语言模型到前端交互的完整自主解决方案 摘要: 开源AI生态已形成完整五层技术栈,让开发者摆脱商业API依赖。1)大语言模型层(Llama、Mistral等)提供媲美商业模型的智能核心;2)数据检索层(Milvus、Weaviate等)实现私有知识管理;3)后端层(LangChain、Ollama等)处理模型调用与流程编排;4)嵌入与RAG层(Nomic、LLMWar
香橙派(Orange Pi 5 Pro/Plus/Ultra,RK3588)本地跑DeepSeek等LLM和QWen-VL等多模态VLM
运维架构越省资源越好。本地用统一 JSON 格式记录日志,后台跑个零依赖的 Python 脚本分析,独立开发者几乎零成本就能揪出高频报错,把时间留给业务迭代。删除了"贯彻极简主义哲学"等抽象表述,改为具体操作描述将"核心场景痛点在于"等 AI 常见句式改为直接陈述需求简化了 Mermaid 流程图说明,避免过度解释将"系统妥协"部分改为更口语化的建议调整了代码注释,使其更自然(如"防止大文件瞬间塞
本文深入解析了Claude Code的会话管理机制与技术细节,主要包含以下要点: 记忆机制本质:Claude Code的"记忆"是固定大小的上下文窗口,而非永久存储,会话结束后内容清零。 会话结构解析: 消息由System/User/Assistant/Tool四种角色构成 内容块分为Text/ToolUse/ToolResult三种类型 工具调用会完整记录四步流程,显著增加上下文体积 Token
说白了,AI 基础设施不是买几块 GPU、接几个模型、上线一个工具就结束了。前面要有算力和模型调用,保证 AI 能跑;中间要有网络、流量和数据治理,保证 AI 跑得稳、结果可信;后面还要有智能体应用和人才培养,保证 AI 能真正进入业务、被长期用起来。企业做 AI,真正影响落地效果的,往往不是某一个单点能力有多强,而是这些环节能不能连起来、跑顺了。
语言模型
——语言模型
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net