logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

2025互联网年度盘点:从Cloudflare看AI如何重塑全球网络格局

Cloudflare 2025年度报告揭示:AI已成为互联网的核心基础设施。报告显示,AI用户行为抓取量暴增21倍,ChatGPT-User流量峰值达年初16倍,表明人们正从搜索转向直接询问AI。Googlebot以4.5%的网页流量占比蝉联爬虫榜首,远超其他AI机器人。开发者最爱Meta Llama等开源模型,文本生成占AI任务近半。同时,网站主对AI爬虫的抵制加剧,GPTBot等训练型爬虫被禁

文章图片
#人工智能#AI
2025互联网年度盘点:从Cloudflare看AI如何重塑全球网络格局

Cloudflare 2025年度报告揭示:AI已成为互联网的核心基础设施。报告显示,AI用户行为抓取量暴增21倍,ChatGPT-User流量峰值达年初16倍,表明人们正从搜索转向直接询问AI。Googlebot以4.5%的网页流量占比蝉联爬虫榜首,远超其他AI机器人。开发者最爱Meta Llama等开源模型,文本生成占AI任务近半。同时,网站主对AI爬虫的抵制加剧,GPTBot等训练型爬虫被禁

文章图片
#人工智能#AI
用 RAG 撬开多模态检索:从文本问答到以图搜图与视频筛选

一文带你玩转RAG:从文本问答到多模态检索的工程实践多模态处理:利用CLIP等模型实现图文跨模态检索分层索引:混合使用稀疏检索(BM25)和稠密检索(向量)两阶段流程:离线建库(数据解析、智能切分、向量化)与在线问答(查询增强、混合检索、精排)应用场景:企业知识管理:合同/制度查询多模态搜索:以图搜图、视频片段检索客服系统:证据驱动的精准回答

文章图片
#RAG
rag-anything —— 一站式 RAG 系统

RAG-Anything是一款基于LightRAG的多模态RAG系统,能够处理PDF、图片、表格、公式等复杂文档。系统特点包括:1)多模态支持,可联合分析文本与图像;2)端到端处理流水线;3)VLM增强查询功能。架构分为文档解析、多模态处理、知识图谱索引和模态感知检索四个阶段,支持科研论文、报告等多模态文档处理。系统提供Python安装包和示例代码,支持OpenAI和硅基流动等API,可配置不同L

文章图片
#人工智能#RAG
【源码级详解】MCP+DeepSeek-V3-0324搭建 mini Manus 开发实战!

本文内容出自九天老师公开课,介绍DeepSeek-V3-0324最新模型,深度结合MCP进行智能体开发实战,带你手搓一个minimanus!本期内容是实战完整部分,DS函数调用详解和MCP讲解可进入社区领取完整版。话不多说,我们直接开始!

文章图片
#人工智能#python#语言模型
AI 也是脸盲?一文看懂 YOLO 和大模型怎么看世界

本文对比了AI视觉领域的两种主流技术:YOLO系列和视觉大模型(VLM)。YOLO作为快速检测模型,在速度和效率上表现突出,但局限于训练数据;新版YOLO-World已拓展到开放词汇识别。VLM则具备更强的语义理解能力,但计算成本高、响应慢。文章分析了它们各自的应用场景:YOLO适用于实时性要求高的场景如自动驾驶,VLM则更适合需要深度理解的智能交互任务。最后介绍了相关AI学习课程,帮助读者掌握这

文章图片
#计算机视觉
【含教程】MCP今年最大更新,企业级流式HTTP功能全面上线!

MCP工具长期以来主要依赖SSE传输进行异地通信,但其并发性和稳定性不足,难以满足企业级应用需求。为改进这一问题,开发者提出采用流式HTTP传输技术,该技术具备更高并发性、更稳定通信及更易集成部署的特点。MCP官方于2月初在GitHub上提出此方案,并在3月发布流式HTTP通信协议,5月9日的1.8.0版本更新中正式加入了HTTP流式MCP服务器的功能支持。此次更新标志着MCP技术迈向企业级应用的

文章图片
#http#网络协议#网络 +2
TEN 框架:轻松实现与 AI 实时语音对话

TEN框架是一个开源的实时多模态交互框架,专注于低延时语音对话体验。它支持语音、视频、图像和文本的智能体开发,具有插件化、跨语言和可视化编排等特性。框架通过流式处理、并行执行和零拷贝技术实现百毫秒级响应,内置VAD和打断功能确保自然对话体验。应用场景涵盖智能家居、同声传译、虚拟形象等。开发者可通过简单示例快速构建实时语音助手,支持多平台部署和边云协同。TEN框架降低了构建"能听会说&qu

文章图片
#人工智能#人机交互
AI 应用最成功的落地方向:Vibe Coding

AI编程革命:从代码辅助到Vibe Coding的范式转变 过去一年,AI编程经历了从被禁止到被鼓励的转变,如今AI生成代码比例已成为部分公司的KPI指标。编程已成为AI应用最成功的落地场景,正从传统开发模式向"Vibe Coding"(基于直觉的AI编程)演进。这种转变得益于编程的三个特性:结构化输出与自然语言输入的匹配、快速反馈机制以及高价值重复劳动特性。目前主流工具如Cl

文章图片
#人工智能
国产开源!PaddleOCR多模态RAG问答系统(已落地),速速收藏备用。

摘要:PaddleOCR-MultiRAG开源项目突破传统RAG技术局限,实现复杂文档智能处理。项目采用PaddleOCR引擎,不仅能提取普通文本,还能精准解析扫描件、图片、表格等非结构化数据,将其转换为结构化格式。相比传统方案,该项目创新性地实现了文档解构而非简单提取,特别适合金融、医疗等行业处理合同、财报等复杂文档。作为稀缺的"结构化RAG"解决方案,它填补了OCR与RAG

#开源#github#RAG
    共 149 条
  • 1
  • 2
  • 3
  • 15
  • 请选择