登录社区云,与社区用户共同成长
邀请您加入社区
2025年了,还有人把大模型当"聊天机器人"?醒醒吧。从ChatGPT横空出世到Sora炸裂全网,从DeepSeek搅动格局到各类垂直模型百花齐放,AI大模型早已不是"技术圈的自嗨",而是一场**席卷每个行业的底层革命**。
在本地部署大模型是一场非常有意思的探索,梳理了一份全面的指南,希望能帮你找到适合自己的方案。
今天的旅程,我们将攀登:第一座是「看得见摸得着的AI Agent失忆困境」,比如陪你聊天3天就忘了你上周日吐槽过的外卖里的蟑螂壳;第二座是「理解AI Agent记忆的三层脑模型——类比我们自己的大脑皮层、海马体和前额叶皮层」;第三座是「用图数据库Neo4j搭建」,把蟑螂壳、外卖平台、商家、你的投诉习惯、天气状况(那天是不是暴雨影响配送导致商家凑活的?)这些零散的“神经信号碎片”连成长长的“记忆神经
本文分享了将PyTorch训练的ResNet-50模型部署到昇腾910B芯片的完整流程和实战经验。主要内容包括: 模型转换四步流程:PyTorch→ONNX→OM模型→部署,重点解决算子支持性、动态shape处理、量化精度验证等关键问题。 详细操作指南: PyTorch导出ONNX时的常见问题及解决方法 使用atc工具将ONNX转换为昇腾专用OM格式 模型量化(FP16→INT8)及精度验证方法
写给新手的 tensorflow:昇腾 TensorFlow 适配到底是啥?
CANN TensorFlow适配器:当tf.matmul跑在昇腾NPU上时在底层发生了什么
之前有个项目用的是TensorFlow 1.x的代码,想迁到昇腾NPU上跑。发现CANN有TensorFlow的适配层,改几行代码就能用上NPU。这篇文章就来讲讲这个适配层的实现原理和使用方法。
本文介绍了如何将TensorFlow模型迁移到昇腾NPU上运行。通过使用tf_adapter适配层,无需重写模型代码,只需添加少量适配代码即可实现。文章详细说明了环境准备步骤,并以ResNet50为例展示了迁移前后的代码对比和性能数据(NPU比GPU快25%)。同时提供了训练迁移方案、多卡训练示例以及常见问题解决方法(如算子不支持、精度偏差、显存不足等)。最后给出迁移检查清单,帮助开发者验证迁移效
GE图编译器在昇腾CANN里扮演"编译优化器"的角色。FlashAttention的代码写了,但跑得快不快,很大程度取决于GE做了多少优化。算子融合减少HBM访存、内存规划复用存储空间、流并行榨干计算资源。FlashAttention在ops-transformer里定义了怎么算,GE决定了怎么组合、怎么调度、怎么分配内存。两个配合好了,同一个模型在昇腾NPU上的吞吐能翻好几倍。排查性能问题时,别
搭 RAG 系统时,很多同学到了"多跳推理"这一关就卡死了。问题是这样的:你有一份公司知识库,用户问「负责 payment 模块的工程师最近在做哪个项目?」
CANN ATC编译器:模型从Python到达芬奇指令走了多远
当你在昇腾设备上运行大语言模型,输入「昇腾CANN生态很强大」这8个字符时,这些字符会先被拆成多个Token(每个Token对应一个语义单元,比如「昇」「腾」「CANN」等),每个Token就像等待运输的快递包裹,即将开启一段从软件层到硬件层的完整旅程。这段旅程跨越了昇腾异构计算架构(CANN)的多个层级,每一步都有专门的「工作人员」负责,最终在硬件中完成计算,再把结果原路送回你面前。
本文介绍了TensorFlow框架适配昇腾NPU的技术实现方案。适配层主要由三个核心模块组成: op_kernel注册模块:通过为每个CANN支持的算子编写OpKernel实现,将TF算子映射到CANN算子库。与PyTorch的dispatcher机制不同,TensorFlow需要显式注册每个算子。 graph_rewrite模块:通过自定义图优化Pass实现算子融合,将连续算子组合成CANN融合
CANN opbase 仓库拆解:所有昇腾算子的“地基”长什么样
传统 RAG 只会 “找句子”,GraphRAG 才会 “懂逻辑”! 面对跨文档关联、多跳推理、隐性关系挖掘等复杂场景,向量检索驱动的传统 RAG 频频 “断链”、易幻觉、答案碎片化。GraphRAG 以知识图谱为核心,将零散文本转化为 “实体 - 关系” 网络,通过社区检测与全局摘要,让大模型具备关系导航 + 多跳推理 + 全局洞察能力。从企业合规检索、金融风险排查到医疗知识关联,GraphRA
RAG解决检索,但Agent需要记忆。本文从记忆分层架构、Mem0集成、Neo4j图记忆、LangGraph持久化四个维度,提供Agent长期记忆的完整实战方案。包含Mem0+LangGraph可运行代码和图记忆查询示例。
通义千问API实战指南:从环境搭建到应用优化 本文分享了阿里云通义千问API的实战经验,涵盖模型能力、应用场景和接入配置。该API具备128K长文本处理、编程辅助和结构化输出等能力,适用于知识库问答、日志分析和代码审查等场景。环境搭建时需注意Python版本、SDK安装和API密钥安全管理,建议从简单调用开始测试并关注token消耗。实际应用中,提示词工程和错误处理是关键,推荐采用"AI
本文介绍了在Qt应用中集成TensorFlow Lite和ONNX Runtime两大AI推理引擎的实战方案。文章首先分析了本地AI推理在工业质检、医疗影像等场景的必要性,随后展示了Qt+AI的整体架构设计,重点讲解了TensorFlow Lite的集成步骤。通过CMake配置、推理封装类代码示例,详细说明了如何在Qt项目中实现图像分类功能,包括模型加载、图像预处理和推理结果处理等关键环节。该方案
1. 入口在哪?- 前端入口 : main.py 的用户输入框- 逻辑入口 : rag_agent.py 的 get_results() 函数(被 main.py 第 90 行调用)2. Neo4j 连接在哪初始化?每个 Chain 自己初始化 ,不是全局共享的:- vector_chain.py 第 76-84 行: Neo4jVector.from_existing_index()
本项目构建了一个电商知识图谱系统,采用Neo4j图数据库存储数据,结合MySQL关系型数据库和多种技术栈实现。系统包含数据准备、实体抽取模型训练、知识图谱构建和智能问答四个核心模块。通过Label-studio进行数据标注,训练BERT模型实现实体抽取;利用Python连接MySQL和Neo4j完成数据同步;最后基于LangChain框架开发问答系统,支持语义检索和自然语言回答。项目实现了商品分类
本文介绍了一个基于知识图谱的医疗智能问答系统,采用Python+Django/Flask框架开发,结合Neo4j图数据库存储医疗实体关系,并集成BERT模型实现智能问答。系统包含七大功能模块:首页数据可视化、知识图谱展示、智能问答交互、问答记录管理、用户信息管理、登录注册和后台运维。通过ECharts实现数据统计图表,利用Neo4j原生可视化组件展示疾病、药品等实体关联关系。用户可通过对话窗口获取
本文介绍了一个基于知识图谱的医疗智能问答系统,主要技术包括Python、Django/Flask框架、Neo4j图数据库、BERT深度学习模型等。系统功能模块涵盖: 数据统计与可视化首页 Neo4j知识图谱可视化展示 智能问答对话交互 问答记录管理(支持搜索、分页) 用户个人信息管理 登录注册模块 后台运维管理 该系统通过Neo4j存储医疗实体关系,利用BERT模型实现语义理解,提供专业医疗问答服
本文介绍了一个基于知识图谱的医疗智能问答系统,采用Python+Django/Flask框架开发,结合Neo4j图数据库存储医疗实体关系,并集成BERT深度学习模型实现语义理解。系统主要功能包括:1)首页数据统计与折线图可视化;2)Neo4j知识图谱可视化展示;3)智能问答对话交互;4)问答记录管理;5)用户信息管理;6)登录注册模块;7)后台运维管理。该系统实现了医疗知识的智能检索、可视化展示和
过去几年,“本体论”“知识图谱”“GraphRAG”“Agent”“Tool Calling”这些概念在企业知识工程和 AI 应用建设中频繁出现。本体到底应该是文档里的定义、数据库里的结构,还是运行时可以直接执行的业务对象?中台 + Neo4j / 图数据库:把本体做成企业知识资产;:让大模型动态调用知识能力;本体原生 Runtime:让本体直接成为业务运行时。本文将围绕这三条路线,分析它们的架构
本文详细介绍了在Ubuntu系统中配置CPU和GPU版本的TensorFlow深度学习库的方法。文章分为两部分:第一部分介绍CPU版本的配置,通过Anaconda环境快速安装TensorFlow;第二部分重点讲解GPU版本的配置流程,包括NVIDIA驱动程序的三种安装方法(推荐使用第三种)、CUDA和cuDNN的版本匹配与安装步骤,以及最终TensorFlow的安装验证。通过文中的代码和截图指引,
本文系统梳理了Neo4j图数据库的重点研究方向,涵盖基础理论优化、跨学科应用、前沿技术融合等六大领域。在基础性能方面,研究集中于混合存储引擎、多模态查询优化及GPU加速技术;应用层面涉及金融反欺诈、医疗数据分析等场景;前沿探索包括与量子计算、区块链等技术的结合。文章重点剖析了Neo4j在量子通信网络中的应用,通过构建量子网络图模型、优化多约束路径算法,实现密钥分发拓扑优化与安全分析,在墨子号卫星网
Neo4j图数据库研究与应用方向综述 摘要:Neo4j作为领先的图数据库,其研究方向主要涵盖:1)基础性能优化,包括混合存储引擎、多模态查询引擎和GPU加速;2)跨学科应用,如金融反欺诈、生物医疗和工业物联网;3)前沿技术融合,涉及联邦学习、量子计算和区块链;4)特定领域深化,包括电力系统、文化遗产和军事态势分析;5)对比研究与扩展,探索与JanusGraph和向量数据库的协同;6)新兴领域如元宇
摘要:基于Neo4j的军事态势感知系统通过构建动态时空图模型实现战场要素的实时关联分析。系统采用分层规则设计(基础层/关联层/态势层)和多维度特征融合机制,结合静态阈值(历史数据+专家经验)与动态阈值(机器学习+实时反馈)的混合设定方法。关键技术包括时空图数据建模、威胁传播预测算法(最短路径/社区发现/ST-GNN)和实时更新机制。典型应用涵盖动态战场展示、威胁预警及战术推演,需解决实时性瓶颈、数
站在脑机接口的入口处,我们既是探险者也是拓荒者。那些看似神秘的脑电波,在Python和OpenBCI的魔法下,正在变成可编程的数字信号。记住:每个失败的实验,都是离成功更近一步的脚印。保持你的好奇心,也许下一行代码就能打开人机融合的新纪元——毕竟,在脑机接口的世界里,想象力才是唯一的边界。
Neo4j图数据科学(Graph Data Science, GDS)是专为图分析设计的行业领先工具库,提供丰富的算法、机器学习能力与高性能计算框架。以下从核心功能、技术架构、应用场景到实践指南全方位解析这一工具。
大多数模型都由层组成。层是具有已知数学结构的函数,可以重复使用并具有可训练的变量。在 TensorFlow 中,层和模型的大多数高级实现(例如 Keras 或Sonnettf.Module。下面是一个在标量张量上运行的非常简单的tf.Module示例:继承 tf.Mode模块和引申而来的层是“对象”的深度学习术语:它们具有内部状态以及使用该状态的方法。__call__并无特殊之处,只是其行为与Py
neo4j
——neo4j
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net