精致先生个人主页

@jingzhi111

精致先生

2023-12-20 10:14:11 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

Elastic-Job 分布式任务调度

（1）分布式项目中定时任务。如果只部署一台机器，可用性无法保证，如果定时任务机器宕机，无法故障转移，如果部署多台机器时，同一个任务会执行多次，任务重复执行也会出问题。（2）分布式项目任务分片执行。将一个任务拆分为多个独立的任务项，然后由分布式服务器分别执行某一个或几个分片项。是当当推出的分布式任务调度框架，基于Zookepper、Quartz开发的Java分布式定时任务解决方案。用于解决分

关系图： 1、目标：让模型掌握最基础、最通用的语言能力和世界知识。2、怎么做？给模型喂食海量的、未标注的文本数据（互联网网页、书籍、文章、代码等），数据量通常是TB甚至PB级别（万亿/千万亿词）。训练任务通常是“预测下一个词”（自回归语言建模）或“完形填空”（掩码语言建模）。模型不断尝试根据前面的词预测下一个最可能出现的词。3、结果：得到一个基础模型。1、目标：在基础模型强大的通用能力之上，

#深度学习 #人工智能

知识图谱构建

本文系统阐述了流程知识图谱构建与应用的关键环节，包括数据获取与预处理、知识建模、图谱构建、存储、图查询和推理六大核心步骤。重点介绍了各环节的技术方案与实现方法，如通过NLP技术处理非结构化数据、本体建模工具Protégé的应用、实体抽取与消歧技术、图数据库选型策略等。文章还强调了质量评估与更新维护保障机制，并提出了知识图谱与大模型结合的三种方式：知识注入、实时调用和推理增强，以提升大模型的知识准确

#知识图谱 #人工智能

智能体记忆管理

本文提出了一种基于向量数据库的智能体记忆管理系统设计方案。系统采用分层架构，包括短期工作记忆和长期语义记忆，结合向量数据库与知识图谱实现多模态数据存储与检索。关键技术包括高效的向量检索算法（HNSW/IVF）、动态存储策略（重要性评估与时序衰减）以及智能检索机制（多阶段过滤与上下文感知）。系统特别注重隐私保护，采用差分隐私、联邦学习等技术确保数据安全。典型应用场景涵盖个性化服务、复杂任务执行和情感

智能体记忆管理

LoRA和QLoRA微调

LoRA和QLoRA是两种高效微调大语言模型的技术，通过低秩矩阵分解和模型量化显著降低计算资源需求。LoRA冻结预训练权重并注入可训练的低秩矩阵，仅需优化少量参数；QLoRA进一步引入4位量化技术，使大模型微调可在消费级GPU上运行。两种方法在保持模型性能的同时，将参数量降至全量微调的千分之一以下，支持快速任务切换。实践环节详细介绍了代码实现步骤、关键参数配置（如秩、学习率等）、训练监控方法和常见

#人工智能

大模型原理

大模型技术综述：本文系统介绍了多模态大模型的技术架构与应用场景，包括GPT-4、Claude3等主流模型分类。重点解析了Transformer架构的预训练机制和语言统计规律学习原理，详细阐述了知识蒸馏和量化两大核心技术。同时深入探讨了vLLM推理引擎的优化策略，包括PagedAttention和KVCache等关键技术创新，为提升大模型推理效率提供了解决方案。文章涵盖从模型训练到部署落地的全流程技

GPT-4-turbo, Claude 3 (Sonnet/Haiku), Gemini 1.5 Pro/Flash, Llama 3 都是优秀选择。

#人工智能

共 12 条

请选择