logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

RAG技术综述

*RAG(Retrieval-Augmented Generation,检索增强生成)**是一种结合信息检索和生成式AI的技术架构,通过从外部知识库中检索相关信息来增强大语言模型的生成能力,从而提高回答的准确性和可靠性。

#人工智能
AI相关专有名词大全

随着人工智能技术的快速发展,相关的专业术语和概念也日益丰富。对于初学者来说,这些术语可能会让人感到困惑。本文将为您介绍一些常见的AI相关专有名词,帮助您更好地理解这个领域。

#人工智能
模型微调哪些事

这些问题看起来琐碎——模型存在哪?怎么装依赖?重复跑会怎样?但正是这些"小问题"构成了真正的理解。会跑脚本不等于懂模型,就像会开车不等于懂发动机。但当你知道油箱在哪、变速箱怎么工作、为什么不能一直踩油门不换挡——你就从"会开车"变成了"懂车的人"。微调模型也是一样。知道权重存在哪、每次训练从哪个起点出发、为什么不能无脑叠加训练——这些才是让你从"跑通了脚本"变成"真正掌握了微调"的关键。

#python#开发语言
模型微调脚本

基于中文 Embedding 模型的本地微调 demo。

#人工智能
AI 用户意图识别与 Agent 流程详解

Agent 流程:用户输入 →意图识别(不调大模型)→ 智能体/分支选择与 Tool 过滤(不调大模型)→ 大模型推理(只在此步调 LLM)→ 执行 Tool/返回结果。意图识别:在本地用规则 + 向量相似度 + 轻量分类三级策略,由快到慢逐级兜底,输出主意图、置信度和备选,并据此做置信度分级决策。不调用大模型:把意图识别视为检索/分类问题,用规则、Embedding 小模型和轻量分类模型即可,达

#人工智能
java熔断、降级、hystrix监控

一、hystrixhttps://blog.csdn.net/zjcsuct/article/details/78198632二、实现方式1.通过注解实现2.AOP实现3.继承方式实现三、hystrix监控1.单机监控修改项目配置1、pom.xml<dependency><groupId>com.n...

#hystrix
大模型连“数数“都会数错

数数会数错"这件事,看起来是一个小 bug,实际上揭示了大模型的根本架构局限——它是一个并行的模式匹配引擎,不是一个顺序的计算机器。它擅长"大致理解”,不擅长"精确操作"。这不是通过增加参数、增加训练数据就能解决的问题——你给一台没有循环指令的硬件再多的数据,它也学不会 for 循环。这是架构层面的天花板。所以下次当你惊叹于 AI 写出了一段完美的代码时,不妨让它数一数那段代码有多少行。也许它会告

#人工智能
给 AI 模型“贴壁纸“:LoRA 微调的原理与实战

微调时的参数变化是低秩的,可以用两个小矩阵的乘积来近似。但这一句话改变了整个大模型微调的格局。在 LoRA 之前,微调一个大模型需要几十张 GPU;在 LoRA 之后,一张消费级显卡甚至 CPU 就能搞定。它让"每个人都能定制自己的 AI"从口号变成了现实。第一篇:AI 怎么知道"酒店≈饭店" → 理解向量和训练原理第二篇:微调实战中的 7 个灵魂拷问 → 搞清楚工程细节第三篇:给 AI 贴壁纸(

#人工智能
vscode初始化设置

{// 如果此设置为 false,则无论新设置的值如何,都不会发送遥测数据。由于合并到 `telemetry.telemetryLevel` 设置,目前已弃用。// 启用要收集的崩溃报告。这有助于我们提高稳定性。// 此选项需重启才可生效。"telemetry.enableCrashReporter": true,// 如果此设置为 false,则无论新设置的值如何,都不会发送遥测数据。已弃用,推

文章图片
#vscode
从“酒店=饭店“说起:一个程序员的 AI 原理探索之旅

这次对话改变了我对 AI 的认知。之前觉得 AI 是黑盒,是魔法,是只有博士才能理解的东西。一个巨大的"公式",里面有几亿到几千亿个精心调校过的系数。这些系数是从海量数据中,通过反复"完形填空"训练出来的。系数越多、数据越大,"公式"就越准。仅此而已。不需要敬畏,不需要恐惧,但值得尊重——毕竟,让一堆矩阵乘法学会人类语言,这件事本身就足够精彩了。如果你也想动手试试微调一个 Embedding 模型

#人工智能
    共 11 条
  • 1
  • 2
  • 请选择