RH-D 个人主页

@qq_31220341

RH-D

2023-05-08 12:02:08 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

从Java转行大模型应用，提示工程原理和进阶技巧，什么是提示词和提示工程

提示工程是系统性设计、优化、迭代提示词的技术与方法论，属于AI交互的核心技能，无需编程基础，核心目标是通过精准指令，最大化发挥大模型能力，降低无效输出，提升结果可靠性。本质是弥合人类自然语言与AI理解逻辑的鸿沟，让AI按照人类的思考框架、需求标准输出内容，而非随机生成。提示工程不是玄学，而是有规律、可复用的科学方法，适用于ChatGPT、文心一言、通义千问、Claude等所有主流大模型。核心价值：

#人工智能 #机器学习

从Java转行大模型应用，RAG使用效果评估及相关工具

1. 评估落地：优先用Ragas进行快速原型评估，量化核心质量指标与能力指标；用TruLens进行生产级全链路评估与监控，定位问题并迭代优化。2. 应用选型：个人/小团队入门用FastGPT，快速部署验证；企业级场景用RAGFlow或Dify，兼顾扩展性与协作需求；需高度自定义用纯代码开发（LangChain+评估工具）。3. 核心优化方向：围绕“上下文相关性、答案忠实度”优化检索策略（切片、向量

#python #人工智能

从Java转行大模型应用，Qwen2.5-VL 多模态模型学习

多模态模型是能同时处理图像、文本、音频等多种模态数据，实现跨模态理解、生成与交互的 AI 模型，核心是让不同模态数据在统一语义空间对齐，完成图文问答、图像描述、视频理解等任务。Qwen2.5-VL 以动态分辨率 ViT 为视觉编码核心，通过轻量化 VL Adapter 实现高效跨模态对齐，结合 Qwen2.5 LLM 的强大语言能力，构建了覆盖图像、视频、文档的全场景多模态体系。其核心创新在于原生

#人工智能

从Java转行大模型应用，大模型量化实现，模型显存、量化技术与GPU算力

核心占用部分：总显存 ≈ 固定显存 + 动态显存。其中固定显存包括模型参数、梯度、优化器状态，动态显存包括激活值、临时缓存及解码器模型特有的KV缓存（用于自回归生成时缓存键值对，降低重复计算）。模型参数显存：与参数量和精度直接相关，例如FP32精度下每个参数占用4字节，FP16占用2字节，FP8占用1字节，INT4仅占用0.5字节；以Llama2 7B模型为例，FP16格式下参数显存约14GB，量

#人工智能

从Java转行大模型应用，大模型量化实现，AWQ 与 GPTQ 算法

AWQ：轻量、激活感知、端侧友好，低比特（3/4bit）精度更优，量化快、适配边缘设备。GPTQ：精准、二阶优化、生态成熟，云端部署首选，4bit 量化几乎无损，稳定性极强。

#人工智能

从Java转行大模型应用, LangChain的入门

LangChain是一个开源的PythonAI应用开发框架，它提供了构建基于大模型的AI应用所需的模块和工具。通过LangChain,开发者可以轻松地与大型语言模型（LLM）集成，完成文本生成、问答、翻译、对话等任务。LangChain降低了AI应用开发的门槛让任何人都可以基于LLM构建属于自己的创意应用。该图展示了LangChain 技术栈的模块化架构，核心围绕LangChain 框架展开，通过

从Java转行大模型应用，LangChain核心学习（Tools工具+Memory记忆+内置链）

LangChain的核心价值在于“连接”——将大语言模型（LLM）与外部工具、记忆功能、业务逻辑串联，实现更复杂、更具实用性的AI应用。本次重点学习三大核心模块：Tools工具（预制+自定义）、Memory记忆功能、多种内置链，以及Memory的实操应用（多轮对话历史记录）。当预制工具无法满足业务需求（如调用自有API、内部系统）时，可自定义工具。定义工具函数：编写具体的工具逻辑（如调用自有API

#python #人工智能

从Java转行大模型应用，LangChain核心学习，数据检索，Chain使用

LangChain 是一个用于构建大语言模型（LLM）应用的开发框架，核心目标是解决 LLM 上下文有限、无法高效连接外部数据、难以实现复杂逻辑流程的问题。其核心设计理念是“模块化”，将 LLM 应用拆解为多个可组合、可替换的组件，通过组件串联实现复杂功能，核心组件包括：数据检索相关组件、Chain 流程组件、LCEL 表达式语言、记忆组件等。学习重点：掌握各组件的核心作用、使用场景，以及如何通过

#python #人工智能

从Java转行大模型应用，LlamaIndex基本概念学习

数据层：连接器→文档→节点，完成接入 - 分块 - 标准化；处理层：分割器→解析器→摄取管道→元数据提取，实现数据增强；索引层：向量 / 属性图 / 文件管理索引，适配不同检索场景；应用层：索引→检索器→查询引擎→LLM，完成RAG 全链路。

#python #人工智能

从Java转行大模型应用，LlamaIndex入门

LlamaIndex 是开源上下文增强 LLM 应用框架，专注解决大模型无法访问私有数据、上下文有限、缺乏领域知识的问题，是构建 RAG、智能代理、工作流的首选工具之一。代理 =LLM + 工具 + 记忆 + 自主决策不是简单问答，而是能自己拆任务、选工具、多步推理、完成复杂目标的智能体。工作流 =事件驱动的多步骤 AI 任务编排把 RAG、代理、工具调用、数据处理等步骤，串成可复用、可监控、可暂

#java #人工智能

共 78 条

请选择