
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
WebAgent 由阿里通义开源,通过模块化设计和创新训练,推动 Web 智能体在信息检索与复杂推理领域的发展。面向 Web 遍历的基准测试与多智能体系统,针对长上下文导航与信息搜寻难题,提供了丰富的数据集(WebWalkerQA)、多智能体协作机制,并支持 RAG 系统的评测与对比。原生智能体训练框架,专注于提升 Web 智能体的多步信息检索与推理能力,采用 ReAct 框架和数据驱动的强化学习
LLM时代大量的信息来源于网络,并且具有明显的实时特征,比如股价、新闻。这里尝试结合开源版本的聚合搜索工具SearxNG,构建实时网络搜索agent。所用到的示例代码参考和修改自网络资料。
LLM时代大量的信息来源于网络,并且具有明显的实时特征,比如股价、新闻。这里尝试结合开源版本的聚合搜索工具SearxNG,构建实时网络搜索agent。所用到的示例代码参考和修改自网络资料。
deepseek-r1:8b 比较适合笔记本部署,大约5G左右,当然也可以根据电脑配置选择其他版本。ollama将deepseek-r1:8b拉到本地后,就可以开始交互测试了。相比llama.cpp,ollama因为集成各种工具,使用更简单。在mac m1基于llama.cpp运行deepseek。在ollama的官网下载mac m1版本的ollama。2运行deepseek r1。最终获得如下所
faiss是Facebook研究院开发的一种高效的相似搜索和聚类库,能够快速处理大规模数据,支持在高维空间进行相似性搜索。faiss建立vector库过程,即把候选向量集封装成一个index数据库,不需要开发即可实现topk的相似检索过程。
这些 benchmark对比不同方法、不同模型之间的相对优劣,也能测出Agent在特定技能上的表现,比如工具调用、信息检索、代码生成等。benchmark 环境通常是简化、净化过的,而真实世界充满了噪声、歧义、不确定性、动态变化,API 可能不稳定、文档可能过时、用户需求可能反复无常。benchmark也会不断进化,适应越来越复杂的真实世界场景。
这些 benchmark对比不同方法、不同模型之间的相对优劣,也能测出Agent在特定技能上的表现,比如工具调用、信息检索、代码生成等。benchmark 环境通常是简化、净化过的,而真实世界充满了噪声、歧义、不确定性、动态变化,API 可能不稳定、文档可能过时、用户需求可能反复无常。benchmark也会不断进化,适应越来越复杂的真实世界场景。
docker应用如dify访问本地主机部署的ollama,base_url不管配"http://localhost:11434",还是"http://host_ip:11434"都会报错。2)docker容器访问http://host_ip:11434,虽然是主机服务,但ollama默认不绑定0.0.0.0:11434,docker容器同样找不到部署在主机的ollama。linux系统ollama
初筛模型主要应用在从大量文档中初步筛选出几十甚至上百个相关文档,比如BGE-M3、BGE-large-zh-v1.5、Qwen3-Embedding。精排模型是在初筛基础上,找出十几个与问题更相关的文档,并按相关程度排序,比如,bge-reranker-v2-m3、Qwen3-Reranker等。这里使用hf版本的bge-reranker-v2-m3模型,进行测试和验证,假设transformer
langchain中,chain和agent是两种常用工具,都可以通过LLM与外部进行交互。chain链相对固定,开发chain类似于编写面向过程的程序,agent则更智能,自动选择执行工具。这里从sql生成和执行的角度分析langchain和agent的作用。







