logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

从 A-Mem 到分层记忆图谱:法律助手长程记忆的第二阶段优化

A-Mem 解决的是“记忆如何被组织成 note 网络”。法律业务分层解决的是“不同类型记忆如何承担不同角色”。HNSW 风格导航解决的是“系统如何解释自己找到某条记忆”。真实抽取链路解决的是“展示数据是否可信”。如果说上一篇是让系统从 0 到 1 拥有记忆,那么这一篇就是让记忆从“能存能搜”走向“有层级、有路径、可解释”。这还不是最终答案,但已经比第一版更接近我想要的法律 AI 助手:它不只是回

#python
从 A-Mem 到分层记忆图谱:法律助手长程记忆的第二阶段优化

A-Mem 解决的是“记忆如何被组织成 note 网络”。法律业务分层解决的是“不同类型记忆如何承担不同角色”。HNSW 风格导航解决的是“系统如何解释自己找到某条记忆”。真实抽取链路解决的是“展示数据是否可信”。如果说上一篇是让系统从 0 到 1 拥有记忆,那么这一篇就是让记忆从“能存能搜”走向“有层级、有路径、可解释”。这还不是最终答案,但已经比第一版更接近我想要的法律 AI 助手:它不只是回

#python
从零实现BERTopic:OpenAI Embedding + UMAP + HDBSCAN + c-TF-IDF法律文书主题建模

民事案件里可能包含"合同纠纷"、“房产纠纷”、“婚姻家事”、"知识产权"等几十个子类相似案由的文书在不同时期可能有完全不同的裁判趋势新兴领域(如数据隐私、AI责任)的案件无法用预定义分类覆盖从零实现BERTopic四步管线,不依赖bertopic/torch/transformers三层优雅降级:UMAP→PCA, HDBSCAN→cosine clustering, jieba→regex完整的

#c语言
从零实现BERTopic:OpenAI Embedding + UMAP + HDBSCAN + c-TF-IDF法律文书主题建模

民事案件里可能包含"合同纠纷"、“房产纠纷”、“婚姻家事”、"知识产权"等几十个子类相似案由的文书在不同时期可能有完全不同的裁判趋势新兴领域(如数据隐私、AI责任)的案件无法用预定义分类覆盖从零实现BERTopic四步管线,不依赖bertopic/torch/transformers三层优雅降级:UMAP→PCA, HDBSCAN→cosine clustering, jieba→regex完整的

#c语言
基于混合语义溯源的法律文档摘要可追溯系统设计与实现

在法律AI应用中,“幻觉”(Hallucination) 是最致命的问题。当AI摘要系统输出一句"法院认定合同有效",律师和法官需要立即验证——这句话在原文的哪个位置?如果无法溯源,AI生成的摘要就毫无法律应用价值。信任危机— 生成的要点没有引证,用户不敢采信效率低下— 用户需要手动在几十页原文中搜索对应段落责任风险— 错误引用导致的法律后果无法追责提出了一种无GPU、纯API的法律文档溯源方案双

#python
SAILER启发的法律类案推荐系统:向量检索+结构化要素四维匹配

在法律AI中,类案推荐是高频需求——法官需要参照先例,律师需要援引判例。语义漂移。案例A: 张三诉李四买卖合同纠纷,争议焦点是"违约金计算方式"案例B: 王五诉赵六买卖合同纠纷,争议焦点是"货物质量不合格"案例C: 甲公司诉乙公司建设工程合同纠纷,争议焦点是"违约金计算方式"纯向量检索:A↔B 相似度=0.85(同为"买卖合同",文本重叠大)实际相关性:A↔C 更相关(同一争议焦点,虽然合同类型不

#python
到底了