logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

打破AI Agent开发困局:AIO Sandbox如何用一个容器解决开发者的所有痛点

传统的数据科学流程是高度手工的:Jupyter Notebook里跑代码,生成的图表手动保存,数据清洗脚本单独维护。:对于GPT来说,它只需要知道"我可以执行代码",而不需要关心底层是Jupyter还是REPL,是本地还是远程。注意这里的妙处:浏览器下载的内容、Jupyter生成的文件、Shell操作的对象,都是同一个文件系统中的数据。Jupyter生成的图表,文件API可以立即访问。:一个任务在

#人工智能
当 PPT 也开始“自己写自己”:一个多智能体系统从想法到整套演示稿的完整落地实践

浏览器像是总控大厅,Next.js 是前台小妹,后端的多个 Python 子项目是几条不同的生产流水线,而每条流水线里又有一群各司其职的 AI 工人(Agent),负责选题、调研、写稿、质检、导出 PPT。如果你对多智能体、RAG、应用级 AI 工程化这些方向感兴趣,不妨亲自把 MultiAgentPPT 跑起来,改一改、拆一拆、接入你自己的数据源,这个过程本身,就已经是一份非常不错的“进阶实践教

代码开源!不用 GPU 也能跑的 WPF 视觉检测软件(Emgu CV + SQLite)

OpenCVDS是一个简单易用的开源图片批量处理计算机视觉检测软件,初衷是用以补充Windows平台的一些视频监控系统没有的视觉检测记录分区保存功能。通过批量处理图片,可以快速完成大量图片的视觉检测任务。一款开源的计算机视觉检测软件,以其简单易用、功能全面的特点受到了大家的好评。它不仅补充了现有视频监控系统在视觉检测记录分区保存方面的不足,还提供更加便捷、高效的视觉检测体验。主要目标是补充现有视频

#开源#wpf#视觉检测 +2
.NET+AI | Agent | 启用工具调用(6)

通过 Function Calling (函数调用) 技术,让 Microsoft Agent Framework (MAF) 构建的 AI Agent 能够调用外部工具,突破大模型"知识截止"和"无法操作"的限制,实现实时数据查询和业务操作。MAF 函数调用:让 .NET Agent 具备真实世界交互能力。MAF 函数调用:让 .NET Agent 具备真实世界交互能力。:让 Agent 调用外

#.net
SoundFlow 开源 .NET 音频引擎

它提供了一系列全面的音频播。支持高精度音频分析(频谱、RMS 电平)与可视化(波形、频谱图),支持实时音频数据流处理(如波形绘制、频率分布分析。互动教学应用的音频录制与可视化(如频谱分析教学),支持多轨音频编辑与非破坏性处理,适用于音乐制作与影视后期。:通过连接音频源(如文件、流)、修改器(效果处理)、混音器和分析器构建定制化音频管道。放、录制、处理、分析和可视化功能,所有这些都包含在一个结构良好

#音视频
17.3K Star!微软开源VibeVoice,AI语音合成新突破,支持90分钟多人对话和实时流式TTS

采用创新的连续语音分词器和next-token扩散框架,结合大语言模型理解上下文和对话流程,突破了传统TTS系统在扩展性、说话人一致性和自然对话方面的限制。一直在找能生成自然对话的AI语音工具,试过不少TTS系统,要么只能单人发音,要么音质僵硬不自然,更别说生成播客那种多人对话了。,支持最多4个不同说话人的自然对话,每个说话人都有独特的音色和说话风格,说话人一致性表现优秀。,利用LLM理解文本上下

#人工智能
C#/.NET 八月技术盘点:WPF/WinForm、机器视觉与工业上位机实践

本月【DotNet技术匠】涌现出一批高质量的技术文章,从基础控件优化到复杂系统架构,从传统桌面应用到前沿智能识别,展现大家在实际项目中的深入思考与创新实践。从 Halcon、OpenCvSharp 驱动的机器视觉与三维扫描,到车牌识别、扫码工具等智能识别应用的拓展;再到开机自启、自动升级、ScottPlot 图表库等基础功能与生态工具的完善,.NET 技术栈持续向专业化、智能化和高效化发展,为大家

#c##.net#wpf +1
Microsoft Agent Framework - Agent 调用工具 (Function Call)

Microsoft Agent Framework 通过强大的“函数调用”(Function Calling)或“工具使用”(Tool Use)机制,赋予了 AI Agent 调用外部代码、API 和服务的能力。无论是需要 Agent 自主决策的便捷场景,还是要求严格控制的敏感操作,Agent Framework 都提供了相应的模式(前面我们已经介绍了 Microsoft Agent Framew

#microsoft#flask#python +1
规格驱动开发MCP初探

规范驱动开发,简而言之,是一种软件开发过程,在整个开发工作流程中,清晰、详细的规范作为核心驱动力。这些规范涵盖了软件系统的各个层面,包括功能需求、性能指标、接口定义和数据格式,如同建筑中的蓝图,明确地勾勒出最终软件应该呈现的样子,供开发者参考。整体体验下来的感觉就是如果一个功能要实现成什么样子你本身并不是很清楚,并且在使用AI很多次了还没成功实现,不妨试试规格驱动开发,还是有一定帮助的。规范驱动开

#驱动开发
破局AI舆情分析的“最后一公里“:BettaFish多智能体系统深度剖析

当我第一次看到BettaFish这个项目时,被它的"Agent论坛协作"机制深深吸引。它不是简单地用LLM分析文本,而是构建了一个"AI思维圈"——多个智能体在虚拟论坛中激烈辩论、互相质疑、共同演化。你不需要OpenAI Swarm、不需要LangGraph、不需要复杂的分布式架构,就能构建一个工业级的多Agent系统。比如搜索"武汉大学",它不仅返回网页文本,还能提取学校排名、历史沿革等结构化信

    共 1250 条
  • 1
  • 2
  • 3
  • 125
  • 请选择