logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

从Java转行大模型应用,提示工程原理和进阶技巧,什么是提示词和提示工程

提示工程是系统性设计、优化、迭代提示词的技术与方法论,属于AI交互的核心技能,无需编程基础,核心目标是通过精准指令,最大化发挥大模型能力,降低无效输出,提升结果可靠性。本质是弥合人类自然语言与AI理解逻辑的鸿沟,让AI按照人类的思考框架、需求标准输出内容,而非随机生成。提示工程不是玄学,而是有规律、可复用的科学方法,适用于ChatGPT、文心一言、通义千问、Claude等所有主流大模型。核心价值:

#人工智能#机器学习
从Java转行大模型应用,RAG使用效果评估及相关工具

1. 评估落地:优先用Ragas进行快速原型评估,量化核心质量指标与能力指标;用TruLens进行生产级全链路评估与监控,定位问题并迭代优化。2. 应用选型:个人/小团队入门用FastGPT,快速部署验证;企业级场景用RAGFlow或Dify,兼顾扩展性与协作需求;需高度自定义用纯代码开发(LangChain+评估工具)。3. 核心优化方向:围绕“上下文相关性、答案忠实度”优化检索策略(切片、向量

#python#人工智能
从Java转行大模型应用,Qwen2.5-VL 多模态模型学习

多模态模型是能同时处理图像、文本、音频等多种模态数据,实现跨模态理解、生成与交互的 AI 模型,核心是让不同模态数据在统一语义空间对齐,完成图文问答、图像描述、视频理解等任务。Qwen2.5-VL 以动态分辨率 ViT 为视觉编码核心,通过轻量化 VL Adapter 实现高效跨模态对齐,结合 Qwen2.5 LLM 的强大语言能力,构建了覆盖图像、视频、文档的全场景多模态体系。其核心创新在于原生

#人工智能
从Java转行大模型应用,大模型量化实现,模型显存、量化技术与GPU算力

核心占用部分:总显存 ≈ 固定显存 + 动态显存。其中固定显存包括模型参数、梯度、优化器状态,动态显存包括激活值、临时缓存及解码器模型特有的KV缓存(用于自回归生成时缓存键值对,降低重复计算)。模型参数显存:与参数量和精度直接相关,例如FP32精度下每个参数占用4字节,FP16占用2字节,FP8占用1字节,INT4仅占用0.5字节;以Llama2 7B模型为例,FP16格式下参数显存约14GB,量

#人工智能
从Java转行大模型应用,大模型量化实现,AWQ 与 GPTQ 算法

AWQ:轻量、激活感知、端侧友好,低比特(3/4bit)精度更优,量化快、适配边缘设备。GPTQ:精准、二阶优化、生态成熟,云端部署首选,4bit 量化几乎无损,稳定性极强。

#人工智能
从Java转行大模型应用, LangChain的入门

LangChain是一个开源的PythonAI应用开发框架,它提供了构建基于大模型的AI应用所需的模块和工具。通过LangChain,开发者可以轻松地与大型语言模型(LLM)集成,完成文本生成、问答、翻译、对话等任务。LangChain降低了AI应用开发的门槛让任何人都可以基于LLM构建属于自己的创意应用。该图展示了LangChain 技术栈的模块化架构,核心围绕LangChain 框架展开,通过

从Java转行大模型应用,LangChain核心学习(Tools工具+Memory记忆+内置链)

LangChain的核心价值在于“连接”——将大语言模型(LLM)与外部工具、记忆功能、业务逻辑串联,实现更复杂、更具实用性的AI应用。本次重点学习三大核心模块:Tools工具(预制+自定义)、Memory记忆功能、多种内置链,以及Memory的实操应用(多轮对话历史记录)。当预制工具无法满足业务需求(如调用自有API、内部系统)时,可自定义工具。定义工具函数:编写具体的工具逻辑(如调用自有API

#python#人工智能
从Java转行大模型应用,LangChain核心学习,数据检索,Chain使用

LangChain 是一个用于构建大语言模型(LLM)应用的开发框架,核心目标是解决 LLM 上下文有限、无法高效连接外部数据、难以实现复杂逻辑流程的问题。其核心设计理念是“模块化”,将 LLM 应用拆解为多个可组合、可替换的组件,通过组件串联实现复杂功能,核心组件包括:数据检索相关组件、Chain 流程组件、LCEL 表达式语言、记忆组件等。学习重点:掌握各组件的核心作用、使用场景,以及如何通过

#python#人工智能
从Java转行大模型应用,LlamaIndex基本概念学习

数据层:连接器→文档→节点,完成接入 - 分块 - 标准化;处理层:分割器→解析器→摄取管道→元数据提取,实现数据增强;索引层:向量 / 属性图 / 文件管理索引,适配不同检索场景;应用层:索引→检索器→查询引擎→LLM,完成RAG 全链路。

#python#人工智能
从Java转行大模型应用,LlamaIndex入门

LlamaIndex 是开源上下文增强 LLM 应用框架,专注解决大模型无法访问私有数据、上下文有限、缺乏领域知识的问题,是构建 RAG、智能代理、工作流的首选工具之一。代理 =LLM + 工具 + 记忆 + 自主决策不是简单问答,而是能自己拆任务、选工具、多步推理、完成复杂目标的智能体。工作流 =事件驱动的多步骤 AI 任务编排把 RAG、代理、工具调用、数据处理等步骤,串成可复用、可监控、可暂

#java#人工智能
    共 78 条
  • 1
  • 2
  • 3
  • 8
  • 请选择