logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型平台Dify安装部署

本文介绍了使用Docker Compose快速部署Dify AI平台的方法。主要步骤包括:克隆最新版本代码、配置环境变量并启动容器(包含3个核心服务和6个依赖组件)。文档详细说明了访问初始化页面、运维管理、模型接入(特别是Ollama本地模型配置)以及离线部署要点。同时提供了K8s/Helm等可选部署方式,并汇总了端口冲突、文件大小限制等常见问题的解决方案。文中多次引用官方文档和GitHub资源,

#安全#大数据#开源软件
Attention 的进阶变体与推理加速技巧

随着大模型参数规模的增加,Attention 的计算成本显著上升,尤其在推理阶段,计算效率直接影响响应速度和费用。研究者们提出了多种优化技术,主要包括:1. KV 缓存(Key/Value Cache),通过缓存历史 K 和 V,避免重复计算,提升推理效率;2. 稀疏注意力机制(Sparse Attention),如 Local Attention 和 Longformer,降低计算复杂度,支持长

文章图片
#人工智能
AI RAG系列: 第8篇:【常用RAG开源框架对比与选择】

本文为【深入理解RAG】系列第8篇,聚焦主流开源RAG框架的优劣与适配场景,帮助你快速找到最适合自己项目的技术选型路线。欢迎继续关注系列更新!

文章图片
#人工智能#开源
MCP 请求链追踪机制全解析:traceId 背后的真相

请求链追踪(Distributed Tracing)是分布式系统中一种非常重要的调试和监控技术,目的是追踪和记录请求在多个服务间传递的路径。在 MCP 协议中,分布式系统往往涉及多个服务节点(如前端、后端、模型服务、数据存储等),这些节点间通过 HTTP 调用、消息队列、RPC 等方式相互通信。请求链追踪的目标就是将这些跨服务的调用过程串联起来,帮助开发者清晰地了解一个请求从进入到返回的完整路径,

文章图片
#安全#开源软件#人工智能
批量图片对半分:10 行 Python 代码轻松搞定!

本文介绍了一个Python脚本,可批量对图片进行左右或上下对半分割。脚本使用Pillow库处理图片,支持png、jpg等常见格式。通过命令行参数可指定输入/输出目录和分割方向(vertical为左右分,horizontal为上下分)。使用方法简单,只需配置好input_images和output_images目录,运行脚本即可自动完成批量分割,适用于海报制作、数据集处理等场景。脚本会自动为分割后的

#python#java#前端
接口数据自动生成实战指南:从 Mock 到测试数据自动构造

摘要:接口数据自动生成实战指南 本文系统介绍了接口数据自动生成的核心应用场景与技术方案。主要内容包括: 五大典型应用场景:联调Mock、测试数据构造、API文档生成、Prompt构造、业务测试数据 主流技术选型:涵盖JavaScript、Python、Java三大生态的Mock工具链 实用示例代码:展示Mock.js和Python Faker的典型用法 结构化数据生成方案:基于JSON Schem

#开发语言#jvm#学习 +1
AI RAG系列: 第10篇:【RAG的挑战与未来趋势】

什么是RAG(基础入门)RAG完整流程(从文档到回答)为什么需要RAG(实际痛点)系统设计五大关键向量检索与Embedding详解检索与生成的融合策略增强技巧详解(Query Rewrite、HyDE…)框架对比(LangChain、LlamaIndex、Haystack)实战搭建一个完整RAG系统而今天的第10篇,我们从挑战到趋势,画下句号,也拉开新一阶段的序幕。未来的RAG系统,将是:多模态的

文章图片
#人工智能
BERT + 向量相似度:文本相似度计算的语义王炸组合

BERT(Bidirectional Encoder Representations from Transformers)是 Google 提出的预训练语言模型,具备双向上下文理解能力,是语义级 NLP 的开山之作。它能将一句话变成一个高维向量(通常 768 维或 1024 维),这个向量就代表了这句话的语义。

文章图片
#bert#自然语言处理#深度学习
如何用文本向量构建语义搜索索引:一份实战指南

摘要:语义搜索技术原理与实践 本文系统介绍了语义搜索技术的核心原理与实现方案。传统关键词搜索存在语义理解不足的问题,而语义搜索通过文本嵌入技术将文字转化为向量表示,在语义空间中进行相似度计算。文章详细解析了文本嵌入(Text Embedding)的概念,对比了OpenAI、Hugging Face等主流嵌入模型的特点。在技术实现层面,提出了完整的工具链选型建议,包括嵌入生成工具(如text-emb

#人工智能#学习#开源
    共 45 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择