登录社区云,与社区用户共同成长
邀请您加入社区
本文对比了MySQL中两种常用校对集utf8mb4_0900_ai_ci和utf8mb4_pinyin_ci的核心差异。utf8mb4_0900_ai_ci是MySQL 8.0+默认校对集,采用Unicode编码排序,多语言适配好但中文排序乱序;utf8mb4_pinyin_ci专为中文设计,按拼音排序更符合国内业务需求。性能方面,两者在简单查询中无差异,仅在中文排序时utf8mb4_pinyin
本文解释了 MERISE 方法论中的概念数据模型(Conceptual Data Model,MCD)如何作为对话框架,通过在编写任何 SQL 代码之前系统地定义实体、关系和基数,将"我们需要一个数据库"这类模糊请求转化为具体需求。
Qdrant是一个用Rust语言编写的开源向量数据库与相似度搜索引擎。“Qdrant”源自“Quadrant”(象限),寓意其能精准地在高维向量空间中定位数据点。不满足于仅提供一个检索库,而要构建一个功能完整的数据库服务。与Faiss等专注于核心算法、需要大量胶水代码才能集成的库不同,Qdrant从诞生之初就提供了完整的解决方案。它内置了类RESTful的API接口(兼容OpenAPI)、多种向量
本文将从核心概念入手,先帮你搞懂Agentic Workflow的本质、架构和核心要素,然后逐一盘点2024年最实用的5款可视化Agent工作流设计平台,每款工具都会带来完整的实操教程、优缺点分析、适用场景和真实落地案例,哪怕你是刚接触AI Agent开发的新人,也能快速找到适合自己的提效工具。在介绍工具之前,我们先把Agentic Workflow的核心概念讲透,避免你后续使用工具的时候只会拖拽
你现在面对的不是一个普通的“学 AI”问题,而是一个职业再定位问题。Dan Li 说明技术上限在哪里;Amye Kenall 说明出版产品型人才是什么样;Helen King 说明作品集可以从用例库开始;Jane Friedman 说明独立行业观察者也能建立影响力;Thad McIlroy 说明出版 AI 可以成为一个长期写作与咨询方向;Springer Nature、Elsevier、Wiley
本文介绍了Elasticsearch推出的ES|QL查询构建器,支持JavaScript和TypeScript开发。该工具提供流式API、类型安全和方法链式调用,避免了手动拼接字符串的风险,并支持自动值转义和IDE自动补全。文章通过Web服务器错误日志分析的示例,展示了如何逐步构建复杂查询,包括过滤、计算列、聚合和时间维度分析。同时介绍了三种表达式写法(原始字符串、表达式构建器和模板标签)和安全查
摘要: 本文以航空业为喻,强调稳定可靠的PostgreSQL数据库运维应追求"无聊"而非"刺激"。文章指出,看似平淡的日常维护(如定期备份、参数调优、慢查询监控)实则是长期安全的保障,能显著降低事故频率与成本。相反,追求短期节省往往导致频繁救火,消耗更多资源并损害客户信任。作者提出具体运维节奏建议(每日检查指标、每月恢复演练、年度故障转移测试),并指出真正的
本文深入解析了 LangChain 向量存储(Vector Stores)在 RAG(检索增强生成)架构中的核心作用。文章首先阐述了向量数据库的工作原理,即通过将文档和查询转化为高维向量,利用余弦相似度等算法进行语义匹配,而非传统的关键词匹配。重点介绍了如何利用 SIMD 指令集和近似最近邻(ANN)技术(如 FAISS)来优化海量数据的搜索速度与精度。
《CacheSQL:从手写数据库原型到工程化产品的重生之路》讲述了作者如何将一个2000行代码的B+树数据库原型改造为可交付产品的过程。核心保留了B+树算法和软删除机制,同时新增了SQL引擎、HTTP接口、主从复制等功能模块。项目结构从平铺改为分层,实现了线程安全、SQL解析优化,并建立了53项单元测试和6项集成测试。作者分享了AI在代码生成与人工决策中的协作经验,强调测试和文档对产品化的重要性,
本文深入解析线程池的价值与局限。线程池通过复用线程降低创建/销毁成本,控制并发数量(如10000次任务只需10个线程),显著提升资源利用率。但其本质仍是多线程模型,无法解决阻塞等待(如HTTP请求卡住线程)、操作系统级调度不可控、资源竞争等根本问题。特别在高IO场景中,阻塞线程会快速耗尽线程池,导致吞吐量骤降。文章指出,真正的优化方向在于Reactor事件驱动和协程调度模型,这些方案能从根本上解决
通过以下命令查看 mysql 数据库:连接到服务器:mysql -u 用户名 -p 密码运行 show databases;命令获取所有现有数据库选择数据库:use 数据库名;查看表:show tables;查看表结构:describe 表名;查看数据:select * from 表名;首先需要使用 MySQL 客户端连接到服务器。命令将返回一个结果集,其中包含所有现有数据库。
目标:快速帮助编辑理解样章内容。300 字摘要;100 字摘要;3 条核心观点;章节结构概括。你是一名资深图书编辑。请基于知识库中的样章内容,生成该样章摘要。要求:1. 不得添加原文没有的信息;2. 摘要应体现主题、核心观点和论证路径;3. 给出引用依据;4. 如果原文信息不足,请明确说明。请用 300 字概括样章主要内容,并列出 3 个核心观点。用一个小型但完整的 RAG 系统,证明你能把大模型
本文深入介绍企业云盘权限体系设计,从RBAC到ABAC的技术演进与实战落地
对于有更高数据安全要求的企业,听脑AI提供私有化部署选项,所有数据完全存储在企业本地服务器,不流出企业内网,从根本上杜绝数据泄漏风险,满足企业数据不出域的合规要求。听脑AI企业版提供SaaS企业版、API开放平台、私有化部署三种交付模式,企业可以根据自身规模、IT架构、数据安全要求灵活选择:对于10人以内的中小团队法务部门、中小型律所,数据敏感度适中,需要快速上线使用的,推荐选择SaaS企业版,无
原文:towardsdatascience.com/spoiler-alert-the-magic-of-rag-does-not-come-from-ai-8a0ed2ad4800?
尤其适合高准确性、高可信度、高知识密度场景下的AI产品建设,例如科研搜索、法律知识库、医疗文献问答、专利检索、企业知识管理和智能研究助手。对于科研、法律、医疗、金融、专利等高准确性场景,大模型不能只“生成得像”,还需要可追溯、可验证、可控。如果企业本身是做学术搜索、法律搜索、医疗知识库、专利检索、企业知识管理、AI Agent、智能问答系统或大模型应用平台,这份履历的匹配度会非常高。设计并上线个性
作用:用 Python 类映射数据库表结构,让 ORM 能操作数据库。继承 SQLAlchemy 的创建基类Base。为每个数据库表定义对应的模型类(如CategoryNews用tablename指定表名,用定义字段、类型、约束(主键、外键、索引等)。字段设计完全参照数据库表结构,确保一一对应。模型类规范:基类,继承数据库表模型类,继承基类属性及类型参照数据库表定义这是一张图片,ocr 内容为:模
随着结构健康监测(SHM)系统的规模不断扩大,监测数据的安全性、完整性和可追溯性成为了关键挑战。传统的集中式数据管理系统面临着数据篡改、单点故障、信任缺失等问题。区块链技术作为一种分布式账本技术,为解决这些问题提供了创新的解决方案。传统SHM数据管理面临的挑战:区块链技术的优势:区块链(Blockchain)是一种分布式数据库技术,通过密码学原理将数据区块按时间顺序相连,形成链式结构。每个区块包含
随着物联网、大数据和人工智能技术的快速发展,数字孪生(Digital Twin)技术正在成为结构健康监测领域的重要发展方向。数字孪生通过构建物理结构的虚拟映射,实现对结构状态的实时监控、预测分析和优化决策。传统SHM面临的挑战:数字孪生技术的优势:数字孪生是指通过数字化手段,在虚拟空间中构建物理实体的高精度映射模型,实现物理实体与虚拟模型的实时数据交互和双向映射。核心特征:数字孪生技术的发展经历了
本实验基于助睿零代码数据集成平台(ETL平台),完成订单利润分流处理任务。实验通过可视化拖拽方式构建数据处理流程,主要步骤包括:1)登录实验平台并创建项目;2)同步MySQL数据源;3)新建转换流,使用表输入组件读取订单和产品数据;4)通过记录集连接实现两表关联;5)使用字段选择、过滤记录等组件进行数据处理;6)将盈利和亏损订单分别输出到Excel文件。实验帮助学生掌握ETL平台的基本操作和数据处
声发射(Acoustic Emission,AE)技术是一种动态无损检测方法,通过接收材料在受力过程中释放的弹性波来监测结构内部的活动。这种技术能够实时捕捉材料内部裂纹萌生、扩展,纤维断裂,以及界面脱粘等微观损伤过程,被誉为"结构健康的听诊器"。声发射现象最早由德国人Kaiser在1950年代系统研究,他发现金属材料在受力过程中会发出可检测的声波信号。经过70多年的发展,声发射技术已成为结构健康监
MyBatis-Plus 是由国内开发者开源的 MyBatis 增强框架,无侵入式扩展 MyBatis 功能,解决原生 MyBatis 冗余 CRUD、硬编码字段、分页繁琐等痛点。@Data零SQL实现单表 CRUD,大幅减少冗余代码Lambda条件构造器解决硬编码痛点,提升代码质量内置逻辑删除、自动填充、分页等企业功能,开箱即用代码生成器+Service 封装,极致提升开发效率。
摘要:提示词模板是LangChain中的核心组件,用于动态生成大语言模型(LLM)请求。它通过占位符机制实现提示词复用,支持字符串模板(PromptTemplate)和聊天消息模板(ChatPromptTemplate)两种形式。主要优势包括:1)提高开发效率,避免重复编写提示词;2)实现工程与内容的关注点分离;3)保证提示结构一致性;4)便于统一维护修改。LangChain还支持从LangCha
Schema(模式)是数据库中对数据结构的定义和组织方式。表(Table)字段(Column)数据类型(Data Type)索引(Index)约束(Constraint)关系(Relation)简单来说:Schema = 数据的“蓝图”或“结构说明书”数据是房间里的物品表是房间Schema 就是整栋楼的设计图数据如何组织系统如何扩展查询是否高效数据是否可靠Schema 是数据世界的“架构设计图”,
多数开发者总是觉得向量数据库是Agent记忆的唯一选择。谷歌云开源的Google Always On Memory Agent,以“去EMBEDDINGS化”SQLite替代向量数据库的极简方案,打破了这一认知惯性
Valkey技术解析与演进摘要 Valkey作为Redis社区分叉项目,在开源许可争议背景下迅速崛起。本文从技术架构、性能优化和生产实践三个维度剖析其创新: 架构突破:保留Redis单线程核心的同时,通过异步I/O线程、缓存友好型字典和双通道复制实现性能飞跃,吞吐量提升230%,延迟降低69.8%。实验性RDMA支持更带来2-3倍的网络性能提升。 生产级能力:哨兵模式引入协调故障转移机制,集群规模
Redis是一款高性能内存数据库,诞生于2009年,旨在解决传统磁盘数据库的性能瓶颈问题。作为远程字典服务器,Redis不仅支持键值存储,还提供丰富的数据结构如字符串、哈希、列表等,并具备持久化、高可用等特性。其单线程事件循环模型通过内存操作、高效数据结构和I/O多路复用实现10万+QPS的高吞吐。Redis支持主从复制、哨兵模式和Cluster集群三种部署方式,满足不同场景下的高可用需求。在实际
他的系统在模型调用上做得相当不错 —— 选了该领域能力最强的模型,上下文给得够全,提取内容也基本准确。但面试官偏偏不问模型选型、不问数据量,直接奔着**输出格式**去了。
前段时间有个录友跟我复盘面试,他面了某国企的 RAG 开发岗。面试官也不跟你客气,直接问核心链路。 面试官:“你说你做了 RAG,那完整流程到底是什么?”他:“就是把文档向量化,用户提问检索,然后给模型生成答案……”
全部下载 11 个000.tar010.tar,校验 md5,逐个解压,最后用.mat文件划分 train/val/test。这就是原作者提供的官方完整流程。
Nous Research 在 2025 年末开源了 Hermes Agent,定位是"自我进化的 AI Agent"。这个项目有个部分特别值得细看——它的记忆系统。
`Milvus` 是开源的分布式向量数据库,非常适合大规模的向量检索场景优点:高性能检索、弹性扩展、生态完善官网的`Milvus` 高度解耦的系统架构图
主包目前研一,从2.26开始约面30+,工作日平均每天4场面试。目前是2个面试挂了,其他基本过,还有几个在流程中,结果没出。涵盖七八个中大厂,几个独角兽,和若干小厂。大多投的是多模态大模型算法,着重投research岗
对于实时时序数据处理来说,选对了一体化的引擎其实已经解决了80%的底层问题,剩下的20%问题基本都是来自于我们做业务设计、参数配置的时候,还带着原来拼开源三件套的老思路,没有适配时序实时处理的特性。
摘要: 文章探讨了大模型在长对话场景中指令失效的问题及解决方案。常规Prompt写法在短对话中有效,但随着轮数增加,模型倾向于延续对话风格而非执行指令。作者提出两种改进方法:1)将指令与历史消息合并放入System Prompt,用户输入改为任务指令;2)在用户输入后追加指令要求。这两种方法通过重构上下文,打破对话惯性,引导模型聚焦任务而非闲聊。从技术层面分析,这利用了Attention机制的近因
2026年AI大模型格局分析报告 核心要点: 主流模型特性分化明显: GPT-6(200万Token窗口)擅长复杂推理和长文档处理 Claude 4.7在编程基准登顶,代码生成质量最优 Gemini在多模态理解和实时搜索表现突出 DeepSeek成为中文处理性价比首选 关键性能对比: 代码生成:Claude > GPT > Gemini 中文处理:DeepSeek > GPT &
CrewAI里每个Agent是一个Agent对象,但很多人把它当成一个带prompt的函数。这是最大的误解。# 这里踩过坑:角色定义太模糊会导致Agent行为漂移role='数据分析师',goal='从原始数据中提取关键指标',backstory='你是一个严谨的数据分析师,擅长发现数据中的异常模式',# 别这样写:backstory写太长反而让Agent困惑# backstory='你是一个数据
上周三我们团队把内部的 AI 员工系统从 Claude Sonnet 4.6 切到 Kimi K2.6 做测试——老板看到月光智能那边放出的 K2.6 基准分数,说"试试这个,便宜还快"。OpenClaw 是我们内部跑 Agent 任务的主力框架,问题来了:K2.6 官方 API 直连延迟波动挺大,P95 能飙到 1200ms,有时候 OpenClaw 的 task loop 直接超时挂掉。
Gridview7.0智能体版本于5月1日至6月30日开启公测,主要升级四大方向:1)新增材料计算与运维双智能体,支持自然语言交互完成科研计算(兼容VASP等专业软件)和智能运维;2)采用Slurm+K8s双调度架构,实现多元算力统一管理;3)深度适配国产硬件生态,强化三维可视化与信创建设;4)集成AI驱动自动化流程,降低运维门槛。公测用户可享免费部署和千万Tokens福利。
茶馆外的夜风渐凉,福州的灯火映在茶碗里。小羊悄悄锁屏了那份写满“All in AI”噱头的调研报告,这一刻,那些花哨的参数显得格外轻浮。“我们到底需要一款什么样的数据库?”L老师起身推开窗,缓缓说出了整晚论道的定论,“不是一款随波逐流的杂家,而是一款守得住底线、扛得住洪峰、读得懂未来的重器。”看懂了达梦,就看懂了 AI 时代数据库底座的生存法则。那是三道“守底线”的严厉:认清边界、死守内核、安全铸
这一周用 Claude Code + DeepSeek V4-Pro 替代原生 Claude 的体验只能用一个词形容——舒坦。账号不会被封、账单看得懂、能力跟得上、Skills 链路无缝。唯一让我难受的就是不收图这一件事,每次切回 Claude 都觉得是退回到了上一个时代。这次识图模式灰度,不只是 DeepSeek 自己补一块拼图,对 Claude Code 用户来说,这是国产模型替换闭源 SOT
本文从GIS专业视角出发,详解LangChain RAG应用中向量数据库的选择要点。涵盖Chroma、FAISS、Pinecone、Weaviate、Qdrant、Milvus、PGVector等主流数据库的性能、可扩展性、GIS支持度及成本对比。重点解析GIS场景下的“空间+语义”混合查询,提供Chroma、Pinecone、Qdrant、Milvus、PGVector的完整代码示例和真实用例。
服务器,也称伺服器,是提供计算服务的设备。由于服务器需要响应服务请求,并进行处理,因此一般来说服务器应具备承担服务并且保障服务的能力。服务器的构成包括等,和通用的计算机架构类似,但是由于需要高可靠的服务,因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。在网络环境下,根据服务器提供的服务类型不同,分为文件服务器、、应用程序服务器、WEB服务器等。中文名服务器外文名serve
数据库
——数据库
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net