
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文记录了Flutter相册APP视频AI分析链路从"接入但不可靠"到"工程稳定"的完整修复过程。针对视频模态存在的八大核心问题,通过增加embedding元数据(记录媒体类型、模型版本、帧来源等)、隔离视频与图片处理链路、适配远端架构重构等关键措施,实现了:1)视频分析过程可追溯;2)错误类型可识别(如重复帧降级);3)不污染图片业务逻辑。同时解决了And
本文记录了一次Flutter相册APP视频AI分析功能的工程修复过程。原项目存在视频输入不可信(可能退化为缩略图)、视频与图片embedding混用(污染图片链路)、视频下游策略激进等问题。修复方案包括:1)确保视频输入可信,完善抽帧诊断信息;2)新增MediaEmbeddingRecord结构区分媒体类型;3)持久化embedding元数据便于追溯;4)隔离视频与图片embedding存储;5)
本文记录了为Memoria项目的MobileCLIP-S2模型补充NCNN版本部署资产的过程。主要工作包括:1)发布NCNN格式的image/text encoder和projection layer模型文件;2)进行ONNX与NCNN输出的数值一致性验证,获得0.99999988的余弦相似度;3)修正了NCNN输入处理的关键技术细节;4)建立版本管理机制并更新工具链。作者特别强调不发布未经充分验
本文介绍了在AI原生相册项目中新增的旅行记忆检测功能。该功能通过分析照片的GPS数据和逆地址解析结果,识别用户短期异地停留的生活轨迹,实现了从"地点展示"到"轨迹理解"的升级。系统采用规则检测而非大模型,通过事件优先聚合、常驻城市识别、置信度评分等算法,在保证性能的同时准确识别1-14天的旅行片段。实现上采用轻量快照对象和isolate计算,避免阻塞UI,并
本文记录了AI相册项目"记忆星球"功能的优化过程。该功能通过球形网络可视化用户的照片关系,但初始版本存在节点过多、视觉杂乱、性能不足等问题。优化策略包括:将默认节点数从96降至42,限制关系边最多30条;隐藏背面节点并按深度调整显示效果;简化背景和UI控件;增加异步加载和隔离计算等。这些调整显著提升了视觉层次感和移动端性能,使功能从技术演示向可用产品迈进。文章强调移动端设计中&
本文记录了作者在维护Flutter智能相册项目Memoria时进行的工程化整理工作。该项目功能复杂,涉及相册扫描、本地数据库、AI模型等多个模块。作者针对运行日志隐私风险、中文乱码、生成文件管理、Flutter版本兼容性等问题进行了系统治理,包括:将调试日志加入.gitignore避免隐私泄露;修复影响AI输出的中文乱码;调整Isar生成文件追踪规则;移除废弃的Impeller配置;迁移depre
在端侧 AI 图片分析链路中,真正困难的往往不是“把模型跑起来”,而是当整体吞吐下降时,能不能快速回答两个问题:时间到底花在哪一段了?代码结构是否还支撑得住后续持续优化?这次改动围绕这两个问题展开,主要做了四件事。
本文记录了将智能相册项目从Google MLKit升级为MobileCLIP2-S2模型的完整技术攻坚过程。面对Android端侧环境的多重挑战,包括ONNX算子缺失、Android14权限沙盒限制、脏标签数据清洗等问题,通过计算图等价替换、全局分页扫描、Prompt工程优化等创新方案逐一攻克。最终实现了毫秒级响应的高维语义搜图引擎,构建了包含意图剥离、多路召回等功能的本地混合检索系统。整个过程展
本文记录了Memoria项目中向量数据库能力的第一阶段落地过程。项目在保留原有Isar业务主库的同时,并行接入了ObjectBox向量索引层,将图片/人脸embedding从业务字段附件提升为独立索引对象。改造内容包括:1)设计专用向量索引实体;2)建立ObjectBox存储服务;3)实现双写双读机制;4)精确版本控制;5)数据治理优化。关键成果包括完成了向量索引的基础设施建设,解决了模型版本混用
本文介绍了智能相册项目中新增人脸聚类主线的关键决策与技术实现。针对原有"人物主题聚类"无法满足身份识别需求的问题,团队建立了独立的人脸聚类系统,核心包括:1) 新增FaceEntity按脸存储数据;2) 构建完整的人脸检测-裁剪-特征提取-聚类链路;3) 实现可替换的FaceEmbeddingService抽象层;4) 开发可视化调试页面。该系统采用"先长大再淘汰&q







