
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
AGENT AI: SURVEYING THE HORIZONS OF MULTIMODAL INTERACTION》这份综述深入探讨了多模态人机交互(Human-Computer Interaction, HCI)的当前发展状态和未来的研究方向。多模态HCI旨在通过语音、图像、文本、眼动和触觉等多种信息模式来实现人与计算机之间的信息交换,这种交互方式在生理心理评估、办公教育、军事仿真和医疗康复等

定义:Multi-Agent系统是一种分布式人工智能模型,其中每个Agent都具有自主决策和交互能力。这些Agent可以分布在不同的物理位置或逻辑层次上,通过网络进行通信和协作。分布性:Agent可以分布在不同的物理位置或逻辑层次上,这使得系统能够更好地适应复杂、动态的环境。自主性:每个Agent都具有自主决策和执行能力,能够根据自身的知识、目标和环境信息做出独立的决策。

Ollama是一个开源框架,专为在本地机器上便捷部署和运行大型语言模型(LLM)而设计。Open WebUI(前身为Ollama WebUI)是一个专为大型语言模型(LLM)设计的可扩展、功能丰富且用户友好的自托管Web管理工具,旨在为用户提供直观、高效的大模型交互体验。本文主要介绍了如何在本地安装Ollama、Open-WebUI,并介绍了Open-WebUI、Dify结合Ollama的一些玩法

AGENT AI: SURVEYING THE HORIZONS OF MULTIMODAL INTERACTION》这份综述深入探讨了多模态人机交互(Human-Computer Interaction, HCI)的当前发展状态和未来的研究方向。多模态HCI旨在通过语音、图像、文本、眼动和触觉等多种信息模式来实现人与计算机之间的信息交换,这种交互方式在生理心理评估、办公教育、军事仿真和医疗康复等

随着ChatGPT的兴起,LLM (Large Language Model,大语言模型) 已经成为人工智能和自然语言处理领域的热门话题。本篇文章我将和大家一起在自己的个人电脑上运行一个大语言模型。

本文全面介绍RAG技术原理与实战开发,涵盖核心基础、架构设计、开发流程及部署优化。采用Cloudflare无服务器架构,集成千问与Gemini模型,指导读者从零构建知识库与智能问答系统,适合不同技术背景开发者学习应用。

文章阐述了大模型面临的三大痛点:知识脱节、幻觉难消、成本失控,指出单纯增加参数已无法解决这些问题。RAG技术通过检索增强生成解决知识来源问题,MoE技术通过混合专家模型实现能力扩展而不爆算力。两者结合形成天然组合,使大模型从"会说话"升级为"能干活",并成为Agent技术的基础。未来大模型的竞争将从参数规模转向系统架构。

AI大模型目前正在成为企业转型升级的关键,同时,政策牵引、技术突破和转型需求等因素也驱动B端企业逐步推进了对于AI大模型的深度应用。AIGC时代的第一波浪潮是大模型的预训练和训练集群规模的不断扩大,紧随其后,第二波浪潮接踵而至,当前和未来将更加聚焦AI大模型的应用落地。算力、网络等基础设施构筑起高效的计算和存储能力,并基于自然语言处理、算法与模型优化等底层技术保障大模型稳定运行,在此基础上,通用大

本文分享了Manus团队构建AI Agent时,从传统Fine-tuning转向Context Engineering的实战经验。文章详细阐述了六大核心工程实践:KV-Cache优化架构设计、Logit Masking解决Tool爆炸问题、文件系统作为外置显存、通过背诵对抗注意力衰减、保留错误轨迹增强学习、引入结构化噪声避免少样本陷阱。这些方法旨在解决Agent在长周期任务中的成本、延迟、准确性和

文章详细介绍了从零开始构建MCP类型AI Agent的九个步骤:首先定义工具目标和背景,然后构建核心功能包括数据加载、向量化、本地存储和语义检索;接着进行本地测试并使用FASTMCP构建MCP服务器;随后配置AI Agent项目并在工具内部运行;最后通过使用MCP资源和扩展AI项目完成整个构建流程。通过这九个步骤,开发者可以系统性地构建、测试、部署和扩展功能强大的MCP AI Agent。








