
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
摘要:几何作图工具正从本地软件转向在线平台,降低了使用门槛并扩展了应用场景。在线几何画板无需下载,支持多设备使用和实时协作,具备动态几何功能,并融入AI技术实现智能作图。推荐工具包括大角几何(AI驱动)、GeoGebra(专业功能)和Desmos(简易函数作图)。未来几何工具将作为基础能力嵌入各类教育产品中,显著提升教学和内容创作效率。

几何画板是数学教学的重要工具,传统本地软件正逐渐被在线工具取代。在线几何画板无需安装、跨平台且易于分享,更适合现代教学需求。新工具"大角几何(Dino-GSP)"提供AI自动生成图形功能,能根据指令快速构造几何图形,并支持SVG和LaTeX导出,适合教师、学生和内容创作者使用。这款AI驱动的在线工具简化了几何作图流程,是数学教学和内容创作的新选择。

这篇文章没有评测工具,也不站队框架,而是试着把 Agent 系统拆回最基础的结构层级:工具是如何被接入的?一件事该如何被规范地完成?一个复杂任务又是怎样被稳定地跑完的?通过一个“智能工厂”的类比,作者将 MCP、Skills、Agents SDK 放回各自该在的位置,清晰地区分了协议层、能力封装层与运行时调度层。当这些概念被放回正确的层级,很多争论会自然消失,架构决策也会变得更清楚。

这篇文章分析了Google DeepMind的AlphaGeometry两代系统在解决数学几何问题上的演进与突破。第一代系统(AG1)采用LLM生成辅助构造、符号引擎推理和搜索系统结合的架构,但受限于表达能力弱、搜索爆炸和数据不足等问题。第二代系统(AG2)通过扩展几何语言DSL、优化搜索方式和推理引擎,特别是引入"double points"技巧,显著提升了IMO几何题解题率

2025 年,开源大模型首次在推理能力与工程可用性上进入前沿竞争,从“复刻闭源”转向与其并跑,并形成多路线并存的生态格局。中国团队成为这一轮跃迁的关键推动者,而企业采用开源模型也由理想选择转为现实的成本与系统决策。开源的核心价值不再是“免费”,而是作为可组合、可改造的系统底座,深度参与 Agent 与复杂 AI 架构设计。

Google DeepMind推出数学AI系统Aletheia,在IMO-ProofBench Advanced数据集取得91.9%的高分。该系统通过"LLM生成+形式验证"的闭环架构,实现了猜想提出、证明生成和机器验证的研究流程。Aletheia的核心创新在于结构化中间表示和验证接口,将数学研究转化为可执行的搜索优化问题。这种工程化方法可能改变数学研究范式,使验证速度突破人类

摘要:文章探讨了大模型在几何推理中的不稳定问题,指出其根源在于缺乏可操作的中间结构。对比了两种解决方案:MathCanvas的内部草图生成和CodePlot-CoT的外部图形环境执行。后者通过让模型编写matplotlib代码来生成可视化中间状态,虽提高了视觉一致性,但存在将几何构造简化为数值验证的局限。作者指出真正的几何推理需要操作抽象的几何对象而非具体坐标实例,并提出构建可操作的图形语言作为更

本文围绕 MathCanvas 展开,讨论其对 AI for Math 的启示:几何能力的瓶颈不在语言推理,而在可操作的中间结构。MathCanvas 将“作图”纳入推理链,使图像成为可参与决策的状态,从而提升几何稳定性。文章进一步结合 大角几何画板 的实践,对比视觉中间态与可执行约束结构的差异,提出未来数学 AI 需同时具备规划、构造与反馈三层能力,才能从会解题走向可验证的推理系统。

摘要: AI在数学领域的突破正从单纯刷题转向结构化推理能力。传统评测基准(如GSM8K、AIME)因数据污染和区分度下降面临挑战,新基准(如实时竞赛流、难题精选)更真实反映模型上限。当前模型分层明显:竞赛解题接近饱和,但IMO级证明和形式化验证(如Lean/Coq)仍是瓶颈。系统架构演进为多阶段解题流程,结合验证器与自动修复实现逻辑闭环。应用上,教育产品聚焦解题路径分析,科研领域推动形式化工具落地

这篇文章没有评测工具,也不站队框架,而是试着把 Agent 系统拆回最基础的结构层级:工具是如何被接入的?一件事该如何被规范地完成?一个复杂任务又是怎样被稳定地跑完的?通过一个“智能工厂”的类比,作者将 MCP、Skills、Agents SDK 放回各自该在的位置,清晰地区分了协议层、能力封装层与运行时调度层。当这些概念被放回正确的层级,很多争论会自然消失,架构决策也会变得更清楚。









