logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

21 - 大模型智能体进阶指南 (5):电影助手的知识革命:从静态存储到实时进化 —— 检索增强与自主学习的协同机制

本文介绍了基于大模型的电影智能助手系统实现,其核心架构分为三层:基础层(向量嵌入与知识库)、功能层(检索与学习系统)和应用层(决策与交互)。系统通过RAG技术解决大模型幻觉问题,支持精准电影查询(85%准确率)、自主学习(日均新增50条知识)、多维度对比和个性化推荐(平均响应时间1.2秒)。实验表明,结合Chroma向量数据库和本地化部署的Mistral模型,在CPU环境下可实现200QPS的并发

文章图片
#人工智能#语言模型#transformer +2
1-大语言模型—理论基础:详解Transformer架构的实现(1)

序列中每一个单词所在的位置对应一个向量。这一向量会与单词表示对应相加并送入后续模块中做进一步出来。在训练的过程中,模型会自动学习到如何利用这部分位置信息。2。

文章图片
#语言模型#transformer#人工智能
11-大语言模型—Transformer 盖楼,BERT 装修,RoBERTa 直接 “拎包入住”|预训练白话指南

"""定义模型配置"""# RoBERTa 模型的配置vocab_size=52_000, #词汇表大小:模型能够处理的唯一词元(tokens)数量 这个值应与之前训练的分词器(Tokenizer)的词汇表大小一致max_position_embeddings=514, #最大位置编码:模型能够处理的最大序列长度(包含特殊标记)num_attention_heads=12,#注意力头数量:多头注意

文章图片
#语言模型#人工智能#自然语言处理
3-大语言模型—理论基础:生成式预训练语言模型GPT(代码“活起来”)

GPT 预训练的核心是基于 Transformer Decoder 的因果语言建模,其计算过程可通过具体示例拆解为 “输入编码 - 注意力计算 - 损失优化” 三步骤。

文章图片
#语言模型#人工智能#python +3
6-大语言模型—预训练:数据处理

质量过滤确保数据 “有用”,冗余去除确保数据 “精简”,隐私消除确保数据 “合规”,词元切分确保数据 “可输入模型”。数据处理就是:先挑好的,再去重,擦隐私,最后拆成小块。

文章图片
#语言模型#人工智能#自然语言处理
9-大语言模型—Transformer 核心:多头注意力的 10 步拆解与可视化理解

输入嵌入层是模型的第一部分,主要用于将离散的输入数据,如文本数据中的单词或字符,转换为连续的数值向量形式。这样的转换是必要的,因为深度学习模型需要处理数值数据。此外,嵌入向量还能捕捉和编码单词的语义信息,相似的单词在嵌入空间中会有相似的向量表示,并且在某些情况下,还可以是上下文相关的。同时,嵌入向量通常比原始数据的维度低,有助于减少模型参数数量,减轻过拟合风险,提高训练效率。接下来,将假设所有输入

文章图片
#人工智能#算法#python +1
6- Python 网络爬虫—验证码突破全解析: 从 OCR 到深度学习的对抗实战指南

OCR 是一种通过计算机算法将图像中的文字(数字、字母、汉字等)转换为可编辑文本的技术。其核心目标是模拟人类视觉系统对字符的识别过程,解决 “图像文字无法直接被机器解析” 的问题。在验证码识别中,主要用于处理由字符构成的静态图形验证码(如登录页常见的 4 位数字字母组合验证码)。OpenCV(Open Source Computer Vision Library)是一个跨平台的开源计算机视觉库,包

文章图片
#python#数据挖掘#人工智能
一文读懂 PPO 算法:强化学习中的 “实用派” 明星—强化学习(11)

PPO 的成功,在于它完美平衡了简单性、稳定性和效率用 “截断目标函数” 替代 TRPO 的复杂约束,实现了策略的稳定更新;允许同一批数据多次更新,大幅提高了数据利用率;仅需普通梯度下降即可实现,工程落地门槛极低。理解 PPO 的核心 ——“在保证策略不突变的前提下,用数据高效地更新”,不仅能掌握一个强大的工具,更能体会到强化学习中 “实用主义” 的设计哲学。用最简单的办法,让策略更新既稳又快。它

文章图片
#算法#机器学习#人工智能 +1
一文读懂马尔可夫决策过程—强化学习(1)

就是 “逛超市时,你现在在哪,决定了你下一步可能去哪,并且每到一个地方能攒多少积分,最后算清楚每个地方到底值多少分拆成 4 个你能摸到的东西:状态:超市里的位置,比如 “入口、零食区、生鲜区、收银台(结账走人)”。转移:从当前位置能走到哪。比如 “在零食区,60% 概率去生鲜区,40% 概率回入口”(只和现在在哪有关,和你之前去过玩具区没关系 —— 这就是 “马尔可夫性”)。奖励:到每个位置给的积

文章图片
#人工智能#算法#python
一文读懂动态规划算法(策略迭代+价值迭代+完整代码)—强化学习(2)

在马尔可夫决策过程(MDP)中,动态规划(Dynamic Programming, DP)算法是求解最优策略和最优价值函数的经典方法。其核心思想是利用,通过迭代更新价值函数或策略,最终收敛到最优解。和。

文章图片
#算法#动态规划#深度学习 +1
    共 52 条
  • 1
  • 2
  • 3
  • 6
  • 请选择