
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
AI编程工具带来开发效率跃升AI编程工具使单个开发者产出媲美传统5人团队,生产效率跃升。Cursor通过深度整合Claude 3.5 Sonnet模型,实现了代码自动补全、跨文件操作和复杂逻辑生成;Supabase通过Postgres.new优化数据库管理,结合AI助手实现智能查询;bolt.new则以AI自动化配置开发环境,形成从编码到部署的全链条辅助。多模态AI技术进入成熟落地期。

DeepSeek-Prover-V2-671B 是deepseek在4月30日放出来的一个用于数学推理的模型,模型基于deepseekV3, 在lean4证明框架内做了自动定理证明能力的训练。

2025年4月5日,meta发布了llama系列模型的第四代,包括Scout、Maverick和Behemoth。llama4支持多模态理解,工具调用,编程,多语种任务(暂不支持中文),知识截止到24年8月。多模态支持上,可输入文本和最多5张图片,输出文本;主要亮点:Maverick和 Scout模型此次也是首次采用了MoE混合专家结构,并且主打的亮点是原生的多模态能力、1千万上下文窗口,目前已经

从70年的人工智能研究中得到的最重要的启示是,利用计算能力的通用方法最终是最有效的,而且优势巨大。其根本原因在于摩尔定律,或者更准确地说,是计算能力单位成本持续呈指数级下降的普遍趋势。大多数人工智能研究都假设智能体可利用的计算能力是固定的(在这种情况下,利用人类知识将是提升性能的少数途径之一),然而在比典型研究项目稍长的时间内,必然会有海量的计算能力可供使用。为了在短期内取得显著改进,研究人员试图

上周manus大火,这周openai也坐不住了。3月12日凌晨,openai推出了新的agent开发套件,包括网页搜索、文件搜索、电脑使用、Responses API等,以及Agents SDK。Responses API 是 OpenAI 推出的一种新的 API 原语,它结合了 Chat Completions API 的简洁性和 Assistants API 的工具使用能力,旨在帮助开发者更轻

文章目录NGSIMNGSIM 概览快速路车道选择算法Interstate 80 Freeway 数据集Lankershim Boulevard 数据集US highway101数据集动态交通分配DTACORSIMAIMSUNNGSIMNGSIM 概览NGSIM项目包含三个部分,摄像头采集的真实数据集、核心仿真算法和文档。next generation simulation快速路车道选择...
实际应用中,Kimi K2 在 15.5 T token 的预训练全程使用 MuonClip,未出现任何训练尖峰,证明 MuonClip 是大规模 LLM 训练稳定可靠的解决方案。可以看到编写的页面排版布局比较美观,而且遵循了RTL的阿拉伯文阅读顺序,使用的绿色、金色是中东人偏好的颜色。通过 MuonClip优化器,可学习的缩放因子 η 把 logits 限制在阈值 t 内,Kimi K2 在 1

GRPO(Groupwise relative policy optimization)群组相对策略优化是deepseek提出的一种RLHF(基于人类反馈的强化学习)技术。首次提出是在DeepSeekMath中,RL被证明在SFT阶段后能有效提升LLM的数学推理能力。在GRPO提出之前,有两种流行的RLHF技术被广泛用于大模型的对齐过程中,分别是PPO和DPO。

2025 年 2 月 28 日下午 5:25,Anthropic发布了claude3.7 sonnet模型,这是首个混合推理语言大模型,即参照人类思考系统的快速反应与慢反思结合的工作模式,将LLM快速响应和思维链深度思考功能集成到统一的大模型中。其核心特点是能够在标准模式下提供近乎即时的响应,或在扩展思考模式下进行可见的逐步推理。从官网的介绍中,可以看到claude3.7在自己的长板能力(编程和前

2025年3月初,号称首个通用性智能体的Manus发布,让agent作为7/24小时自动打工人的多个场景随即在社交媒体上引发热议,内测邀请码一时洛阳纸贵,被炒制数万元,同时带动了150多只AI智能体概念股涨停。据媒体披露,Manus背后的母公司蝴蝶效应的投资方包括真格基金、腾讯等。爆火之后,Manus的资源也是好起来了。不到两周的时间,Manus团队很快与阿里通义千问团队正式达成战略合作,双方将基
