
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
2026 年 3 月 ,Google Research 悄然发布了一篇注定要在 AI 工程圈引发地震的研究——TurboQuant。没有铺天盖地的发布会,没有华丽的宣传 PPT,只有一套扎实到骨子里的数学推导。然而仅在 24 小时内,这项研究就让内存芯片巨头 Micron 和 Western Digital 的股价同步下跌,Cloudflare CEO 将其称为"Google 的 DeepSeek

Midjourney推出全新动漫生成模型Niji7,解决了AI动漫创作的多个痛点。该模型在画面连贯性、提示词响应、线条美学和风格参考功能上实现重大突破,能精准呈现细节,完美执行复杂指令,并保持日式动漫的清爽风格。Niji7特别适合插画师、游戏美术等专业创作者使用,标志着AI动漫生成进入更精准、更具艺术表现力的新阶段。用户可通过添加--niji7参数直接体验这一创新模型。

Meta发布全新AI模型MuseSpark,标志着其AI战略的重大转型。作为Muse家族首款产品,该模型由新成立的MetaSuperintelligenceLabs开发,具备多模态推理、工具调用和多智能体协同能力。技术突破包括:训练效率提升10倍、强化学习驱动的稳定能力增长、创新的"思维压缩"机制。在"沉思模式"下,多智能体协作使推理性能显著提升。应用场景覆

摘要:OpenAI推出内置ChatGPT的Atlas浏览器,直击Google核心业务。与传统浏览器不同,Atlas具备AI实时摘要、任务代理等功能,颠覆被动浏览模式。通过"理解优先"取代传统搜索,Atlas能直接提供精准答案,冲击Google依赖的广告商业模式。基于Chromium内核的Atlas已开放macOS版本,Windows和移动端即将上线。这场浏览器革命不仅挑战Chr

智谱AI发布全新旗舰模型GLM-5.1,综合能力对标ClaudeOpus4.6,在代码能力评测中刷新全球纪录。该模型具备200K上下文窗口和128K输出能力,支持8小时持续工作,可完成从规划到交付的完整闭环。在SWE-BenchPro测试中以58.4分超越GPT-5.4等国际主流模型,并在12项基准评测中表现优异。典型案例显示其能构建完整Linux系统、优化数据库性能等。GLM-5.1提供完善AP

智谱AI发布全新旗舰模型GLM-5.1,综合能力对标ClaudeOpus4.6,在代码能力评测中刷新全球纪录。该模型具备200K上下文窗口和128K输出能力,支持8小时持续工作,可完成从规划到交付的完整闭环。在SWE-BenchPro测试中以58.4分超越GPT-5.4等国际主流模型,并在12项基准评测中表现优异。典型案例显示其能构建完整Linux系统、优化数据库性能等。GLM-5.1提供完善AP

本文介绍了一种通过DispatchMap模式扩展AI Agent工具能力的方法。核心思路是保持主循环不变,通过字典映射将工具名与处理函数关联,实现零成本工具扩展。文章详细解析了路径沙箱(safe_path)安全机制、四个专用工具(read/write/edit文件及bash)的实现,以及如何通过TOOL_HANDLERS字典实现工具分发。这种设计遵循开放-封闭原则,新增工具只需注册到字典而无需修改

本文介绍了一种通过DispatchMap模式扩展AI Agent工具能力的方法。核心思路是保持主循环不变,通过字典映射将工具名与处理函数关联,实现零成本工具扩展。文章详细解析了路径沙箱(safe_path)安全机制、四个专用工具(read/write/edit文件及bash)的实现,以及如何通过TOOL_HANDLERS字典实现工具分发。这种设计遵循开放-封闭原则,新增工具只需注册到字典而无需修改

大模型基准测试:数字背后的真相 摘要:本文深入解析了LLM基准测试的运作机制与价值局限。基准测试通过标准化题库和评分规则,为多元能力的大模型提供量化比较依据。主流测试包括知识与推理(如MMLU)、代码生成(如HumanEval)、对话交互(如ChatbotArena)等类别,采用零样本、少样本或微调等不同测试方式。虽然评分系统(如BLEU、ROUGE等)能客观衡量部分能力,但测试仍存在评分饱和、覆

阿里云发布千问Qwen3.6-Plus模型,实现编程智能体、通用智能体和工具调用三大能力跃升。该模型配备100万token超长上下文窗口,在编程基准测试中紧追ClaudeOpus4.5,部分表现超越;在通用智能体评测中与顶级模型同梯队,多模态能力全面提升。支持主流Agent框架,API调用价格低至2元/百万tokens。实测显示其"氛围编程"能力可快速生成完整应用,标志AI工作








