logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

网页信息检索和复杂推理 - WebAgent

WebAgent 由阿里通义开源,通过模块化设计和创新训练,推动 Web 智能体在信息检索与复杂推理领域的发展。面向 Web 遍历的基准测试与多智能体系统,针对长上下文导航与信息搜寻难题,提供了丰富的数据集(WebWalkerQA)、多智能体协作机制,并支持 RAG 系统的评测与对比。原生智能体训练框架,专注于提升 Web 智能体的多步信息检索与推理能力,采用 ReAct 框架和数据驱动的强化学习

#人工智能
基于LLM+SearxNG的实时网络搜索agent

LLM时代大量的信息来源于网络,并且具有明显的实时特征,比如股价、新闻。这里尝试结合开源版本的聚合搜索工具SearxNG,构建实时网络搜索agent。所用到的示例代码参考和修改自网络资料。

#搜索引擎
基于LLM+SearxNG的实时网络搜索agent

LLM时代大量的信息来源于网络,并且具有明显的实时特征,比如股价、新闻。这里尝试结合开源版本的聚合搜索工具SearxNG,构建实时网络搜索agent。所用到的示例代码参考和修改自网络资料。

#搜索引擎
在mac m1基于ollama运行deepseek r1

deepseek-r1:8b 比较适合笔记本部署,大约5G左右,当然也可以根据电脑配置选择其他版本。ollama将deepseek-r1:8b拉到本地后,就可以开始交互测试了。相比llama.cpp,ollama因为集成各种工具,使用更简单。在mac m1基于llama.cpp运行deepseek。在ollama的官网下载mac m1版本的ollama。2运行deepseek r1。最终获得如下所

#macos
如何用faiss强化基于mysql的文本检索

faiss是Facebook研究院开发的一种高效的相似搜索和聚类库,能够快速处理大规模数据,支持在高维空间进行相似性搜索。faiss建立vector库过程,即把候选向量集封装成一个index数据库,不需要开发即可实现topk的相似检索过程。

#faiss
评估agent能力benchmark收集汇总

这些 benchmark对比不同方法、不同模型之间的相对优劣,也能测出Agent在特定技能上的表现,比如工具调用、信息检索、代码生成等。benchmark 环境通常是简化、净化过的,而真实世界充满了噪声、歧义、不确定性、动态变化,API 可能不稳定、文档可能过时、用户需求可能反复无常。benchmark也会不断进化,适应越来越复杂的真实世界场景。

#人工智能
评估agent能力benchmark收集汇总

这些 benchmark对比不同方法、不同模型之间的相对优劣,也能测出Agent在特定技能上的表现,比如工具调用、信息检索、代码生成等。benchmark 环境通常是简化、净化过的,而真实世界充满了噪声、歧义、不确定性、动态变化,API 可能不稳定、文档可能过时、用户需求可能反复无常。benchmark也会不断进化,适应越来越复杂的真实世界场景。

#人工智能
linux系统ollama监听0.0.0.0:11434示例

docker应用如dify访问本地主机部署的ollama,base_url不管配"http://localhost:11434",还是"http://host_ip:11434"都会报错。2)docker容器访问http://host_ip:11434,虽然是主机服务,但ollama默认不绑定0.0.0.0:11434,docker容器同样找不到部署在主机的ollama。linux系统ollama

#linux#服务器#人工智能
开源向量模型-精排bge reranker示例

初筛模型主要应用在从大量文档中初步筛选出几十甚至上百个相关文档,比如BGE-M3、BGE-large-zh-v1.5、Qwen3-Embedding。精排模型是在初筛基础上,找出十几个与问题更相关的文档,并按相关程度排序,比如,bge-reranker-v2-m3、Qwen3-Reranker等。这里使用hf版本的bge-reranker-v2-m3模型,进行测试和验证,假设transformer

#学习#人工智能#数据分析
langchain中chain和agent的区别和联系

langchain中,chain和agent是两种常用工具,都可以通过LLM与外部进行交互。chain链相对固定,开发chain类似于编写面向过程的程序,agent则更智能,自动选择执行工具。这里从sql生成和执行的角度分析langchain和agent的作用。

    共 74 条
  • 1
  • 2
  • 3
  • 8
  • 请选择