logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

项目分享|agent-browser:Vercel开源的AI智能体浏览器自动化CLI工具

本文介绍了Vercel Labs开源的AI智能体专用浏览器自动化CLI工具agent-browser,该工具基于Rust+Node.js架构,提供AI友好的快照+元素引用机制,支持全平台运行和丰富的浏览器操作命令。文章解析了其AI适配、跨平台、命令丰富、部署灵活等核心优势,以及AI智能体交互、自动化测试、数据采集等应用场景,并提供了npm安装、核心命令实践、云浏览器集成等完整代码示例,为开发者快速

文章图片
#开源#人工智能#自动化
项目分享|LongCat-Flash-Thinking-2601:让AI学会“深度思考”与“动手干活”

本文介绍了美团开源的5600亿参数MoE架构大推理模型LongCat-Flash-Thinking-2601,该模型激活参数量仅270亿,通过环境扩展、多环境强化学习强化了智能体思维能力,还针对噪声环境做了鲁棒性训练,创新推出Heavy Thinking深度思考模式。文章解析了其MoE架构、噪声鲁棒训练等核心优势及数学推理、智能体工具调用等应用场景,并提供了基于transformers的多轮对话和

文章图片
#人工智能
项目分享|nanobot:超轻量级个人AI助手,4000行代码实现核心智能体能力

本文介绍了HKUDS团队开源的超轻量级个人AI助手nanobot,该项目核心代码仅3935行,较同类项目缩小99%,基于MIT协议开源,支持20+LLM提供商和10+聊天平台对接,兼具轻量、高效、易扩展的特性。文章解析了其多端兼容、低资源消耗、易二次开发等核心优势及个人助手、开发辅助、自动化办公等应用场景,并提供了多种安装方式和Telegram、Docker的部署实践代码,为用户快速上手提供参考。

文章图片
#人工智能
项目分享|微软VibeVoice,让机器真正“听懂”和“说出”长对话

本文详细介绍了微软开源的前沿语音AI框架VibeVoice,该项目基于MIT协议开源,主打表现力、长篇幅、多说话者的语音合成,包含长篇多说话者和实时流式两大模型,支持90分钟语音生成、4位说话者及300ms低延迟实时输出。文章解析了其超低帧率分词器、令牌扩散框架等核心创新,并提供了基于Docker的部署步骤和核心调用代码,同时说明其现阶段的使用限制和AI安全设计,为开发者探索该项目提供全面参考。

文章图片
#microsoft#自然语言处理
注册即送H卡算力!一家配环境不收费的GPU算力平台!

AladdinEdu推出新一代GPU算力平台,专为科研用户设计三大核心优势:1)创新计费模式,仅GPU调用时计费,环境配置调试0费用;2)注册即赠50元算力,配备顶级显卡(效率超4090三倍)及实时技术支持;3)限时拼团优惠低至45折,套餐最高立省11701元,成功拼团再赠20元优惠券。平台实现算力即开即用0排队,并提供详细教程助力快速上手,有效解决传统租卡资源浪费问题。

#人工智能#深度学习#机器学习 +2
项目分享|DeepSeek-V3:基于条件记忆与可扩展查找的大语言模型新稀疏维度

DeepSeek-V3项目围绕条件记忆这一全新稀疏维度展开研究,提出Engram模块为大语言模型引入静态N-gram记忆查找能力。该项目剖析了神经计算与静态记忆的权衡关系,在等参数、等FLOPs约束下,Engram-27B模型在知识、推理等多领域表现优于MoE基线,还通过确定性寻址实现高效推理。本文将详解项目背景、核心创新与技术实现,助力理解这一新颖的大模型优化思路。

文章图片
#语言模型#人工智能#自然语言处理
项目分享|复刻20亿美金AI创业公司核心模式:Planning with Files让AI代理工作更高效

Planning with Files是复刻Manus 20亿美金估值核心逻辑的Claude Code插件,通过task_plan.md、findings.md、progress.md三个核心文件,将AI代理的上下文窗口(易失内存)与文件系统(持久硬盘)结合,解决AI记忆易失、目标漂移等问题。插件依托钩子机制实现自动化流程,安装便捷,部署灵活,为复杂任务处理提供规范、高效的AI工作模式。

文章图片
#人工智能
项目分享|MiroThinker:引领开源搜索智能体的技术突破与实践

MiroThinker是MiroMind Research Agent Project的开源实现,聚焦工具增强推理与信息检索能力,覆盖模型、框架、数据集、训练基建四大核心组件。该项目凭借交互式扩展、超长上下文窗口、多尺度模型设计等创新,在HLE、BrowseComp、GAIA等多类基准测试中刷新开源搜索智能体性能纪录。本文详解其核心优势、技术原理与部署流程,为开发者落地搜索智能体提供完整参考。

文章图片
项目分享|MiniMax-M2.1:开源赋能下一代自主应用开发的大模型

MiniMax-M2.1是一款开源的高性能大模型,聚焦编码、工具使用、多语言开发等agentic能力优化,在SWE-bench等核心基准中超越前代及多款主流模型,尤其在全栈应用开发(VIBE基准)和多语言场景中表现突出。本文介绍了该模型的核心能力、创新优势,并提供了基于vLLM/Transformers的本地部署代码,助力开发者快速落地自主应用开发。

文章图片
    共 22 条
  • 1
  • 2
  • 3
  • 请选择