logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【面经】多模态大模型

本文系统梳理了AI领域的核心知识体系,涵盖深度学习基础、大语言模型、多模态技术和工程实践。重点包括:1)Transformer架构核心组件及其在CV/NLP中的应用;2)LLM的预训练、微调(LoRA等)和对齐技术(RLHF/DPO);3)多模态模型的视觉编码器、连接器设计和训练流程;4)分布式训练框架和评估基准。文章还列举了典型面试题,涉及Self-Attention计算、CLIP训练缺陷分析、

#深度学习#面试
【面经】多模态大模型

本文系统梳理了AI领域的核心知识体系,涵盖深度学习基础、大语言模型、多模态技术和工程实践。重点包括:1)Transformer架构核心组件及其在CV/NLP中的应用;2)LLM的预训练、微调(LoRA等)和对齐技术(RLHF/DPO);3)多模态模型的视觉编码器、连接器设计和训练流程;4)分布式训练框架和评估基准。文章还列举了典型面试题,涉及Self-Attention计算、CLIP训练缺陷分析、

#深度学习#面试
【vscode: 基于Code Runner直接运行多文件C程序】

当时搞多文件运行时,找了很多方法(大部分都是改tasks.jsion),花了很多时间,但一直没成功。????后来在百度知道上看到了一个很简单很快捷的方法。而且还因此知道了另一个好用的插件。希望可以给有需要的人一些帮助。直接来个任意门转载自:【vscode: Code Runner如何直接运行多文件C程序】https://mbd.baidu.com/ma/s/WqC2o05f...

#c++#c语言#visual studio code
吴恩达深度学习系列课程课后习题(测试+编程题)

课后习题(测试+编程题)最近在B站看吴恩达的深度学习系列课程,但是B站上没有题目,去coursea上又有限制,一年只能免费申请一门。于是,我便转向了万能的互联网,果然让我给找到了。特此转载一下,给需要帮助的人。原文链接在此其他因为篇幅过短被批回了,那我就在叨叨一下吧。吴恩达的课程还是很不错的,非常详细与厚实,适合入门;不过可能由于他自身研究发现的限制,所以只要讲的是视觉和语音识别的拓展,不过视觉目

#python#深度学习
MindSpore安装之避坑指南

我发现许多人(包括我自己)在安装过程中出现了各种各样的问题,而且这些问题在教程中都没有出现,于是我根据自己的踩坑经验总结出了一份安装避坑指南,请往下看。

#python#开发语言
【论文阅读】Learning Person-specific Cognition from Facial Reactions for Automatic Personality Recognition

本文提出了一种基于个性化认知模拟的自动人格识别方法,通过目标对象的面部反应推断其真实人格特质。该方法创新性地利用神经架构搜索为每个个体构建独特的CNN模型,模拟其在双人互动中的认知过程。关键贡献包括:(1) 将个性化CNN的架构和权重参数化为图表示;(2) 提出基于Transformer的多维边特征学习策略;(3) 在人类-人和人-机互动场景中验证了方法的优越性。实验结果表明,该方法能有效捕捉与人

文章图片
#论文阅读#深度学习#人工智能
Hindsight Experience Replay (HER)复现

本文记录了安装OpenAI Gym环境的踩坑过程,重点解决Python 3.5.2版本兼容、Gym 0.20.0依赖冲突等问题。针对conda环境配置、mujoco_py编译失败等常见错误,提供了添加conda-forge通道、安装GCC开发库等解决方案。同时分享了FetchPush-v1等环境的训练和演示命令,帮助开发者快速搭建强化学习实验环境。适用于Ubuntu/Windows系统,包含从基础

文章图片
#人工智能#深度学习#机器人
【datawhale】RAG学习笔记

RAG(检索增强生成)技术通过融合信息检索与文本生成,构建了包含索引、检索、生成三大组件的智能系统。该技术利用外部知识库动态更新信息,有效减少大模型幻觉问题,并支持领域专业化应用和本地化数据部署。实现RAG系统需要完成文档准备、索引构建、搜索优化和生成集成四个步骤,可采用LangChain、LlamaIndex等开发框架和Milvus等向量数据库。评估指标聚焦检索相关性及生成答案的准确性与忠实度。

文章图片
#学习#RAG#人工智能
    共 17 条
  • 1
  • 2
  • 请选择