《带你实战体验：多模数据库在港落地，技术观察与实践经验》》

Dovis(誓平步青云）

214人浏览 · 2026-06-19 13:24:29

Dovis(誓平步青云） · 2026-06-19 13:24:29 发布

多模数据库在港落地：六位从业者的技术观察与实践经验

6月12日，香港科技园举办了一场以多模数据库与 AI 工程落地为主题的线下技术交流活动。六位演讲者分别从本地化适配、多模引擎设计、AI 底层存储、迁移实践、工业场景、解决方案架构等不同角度分享了各自的经验和判断。本文整理了各议题的主要内容。

孙丽霞 · 本地化适配测试：流程与方法论

LSCM大湾区科研项目及业务发展总经理
《数据库在本地化适配测试实践介绍》

港澳地区的数据库本地化适配并不只是"换个驱动"那么简单。孙丽霞结合大湾区科研项目的实际经历，梳理了几类高频问题：字符集与排序规则差异、存储过程语法兼容性、驱动层行为不一致，以及合规审计日志格式要求等。

她提到，测试阶段容易被忽视的一个环节是回归覆盖率——迁移后功能看似正常，但边界 case 往往在上线后才暴露。她整理的测试方法论大致分为三层：

环境层：操作系统版本、libc 版本、网络策略是否与原环境一致
功能层：SQL 方言兼容性、存储过程、触发器、视图行为验证
性能层：在目标硬件上跑基准测试，不能直接沿用原平台的调优参数

跨境部署时还需额外关注数据出境合规，尤其是涉及个人信息的业务表，需要在架构设计阶段就确定数据分区策略。

萧少聪 · 一条 SQL 打通四种数据模型

数据系统独立技术顾问、AI语义存储技术专家
《一行SQL横跨关系型、向量型、JSON、图型四大模型》

传统做法是针对不同数据类型分别维护一套存储：关系数据库存业务表，向量库存 Embedding，MongoDB 存文档，Neo4j 存图。这种架构的代价是数据同步链路复杂、查询跨库需要应用层拼接、运维成本成倍增加。

萧少聪演示了在统一多模引擎下，用单条 SQL 完成跨模型联查的写法，大致结构如下：

SELECT
    u.name,
    u.profile -> 'department'        AS dept,       -- JSON 字段
    vec_distance(u.embedding, :query_vec) AS score, -- 向量相似度
    r.relation_type                                  -- 图关系字段
FROM users u
JOIN user_relations r ON r.from_id = u.id
WHERE vec_distance(u.embedding, :query_vec) < 0.3
  AND u.profile @> '{"active": true}'
ORDER BY score
LIMIT 10;

这条查询同时涉及关系表的 JOIN、JSON 字段过滤、向量近似检索和图关系遍历，在单引擎内完成，省去了跨库协调的开销。

他也坦承，这种统一模型在极端性能场景下（比如纯向量检索的亿级 QPS）不一定是最优解，更适合的是混合查询频繁、数据关联复杂、工程团队规模有限的场景。

尹海文 · 数据库作为 AI Agent 的基础设施

金仓KVA、公众号【胖头鱼的鱼缸】主理人
《让数据库成为AI Agent的基础设施架构》

一个能实际跑起来的 AI Agent，背后需要解决四类存储问题：

场景	存储需求	常见方案
向量检索（RAG）	高维向量 + 近似最近邻搜索	pgvector / 专用向量库
对话记忆	会话历史持久化、按 session_id 检索	KV 存储 / 关系表
知识库挂载	文档分块 + 元数据过滤	向量 + JSON 混合存储
工具调用结果	结构化中间结果缓存与回溯	关系表 + 时序记录

尹海文的核心观点是：Agent 的"记忆"和"工具"能力本质上是数据库问题，而不只是模型问题。当前很多 AI 应用不稳定，根源在于存储层设计草率——向量索引没有定期 vacuum、会话表没有 TTL 策略、工具调用结果没有落库导致无法排查。

他演示了一个最简的 Agent 记忆写入结构：

CREATE TABLE agent_memory (
    session_id  UUID,
    turn_index  INT,
    role        TEXT,          -- 'user' | 'assistant' | 'tool'
    content     TEXT,
    embedding   VECTOR(1536),
    created_at  TIMESTAMPTZ DEFAULT now(),
    PRIMARY KEY (session_id, turn_index)
);

-- 检索与当前输入最相关的历史轮次
SELECT content FROM agent_memory
WHERE session_id = :sid
ORDER BY embedding <=> :query_embedding
LIMIT 5;