weixin_44457930 个人主页

@weixin_44457930

weixin_44457930

2022-11-25 15:42:04 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

西湖大学强化学习第一讲——基本概念

入职新公司，主要做具身智能，因为之前对强化学习了解的比较少，所以现在开始系统性地学习强化学习。之所以要记笔记，是因为授课老师的PPT都是英文，复习的时候很难快速把知识点装回到脑袋里，只有把学到的知识用自己语言整理一遍，并记录成文档，才更方便复习。

#人工智能

西湖大学强化学习第一讲——基本概念

#人工智能

opencv error: (-215:Assertion failed) size.width＞0 && size.height＞0 in function ‘cv::imshow‘

import cv2 as cv#读取图像，支持 bmp、jpg、png、tiff 等常用格式img = cv.imread("玫瑰.jpg") # 路径得改，否则报错#创建窗口并显示图像cv.namedWindow("Image")# 给窗口命名cv.imshow("Image",img)# 将图片展示在窗口中cv.waitKey(0)#释放窗口cv.destroyAllWindows()错误信

大模型的开发应用（十一）：对话风格微调项目（下）：微调与部署

上篇文章，我们完成了数据集的制作，得到了一个拥有近两万条样本的数据集，随后进行了模型选型，筛选出了 Qwen2.5-1.5B-Instruct 作为我们的基座模型，这篇文章，我们来完成剩下的工作，包括模型的微调与部署。

#人工智能 #自然语言处理

大模型的开发应用（七）：大模型的分布式训练

现代大模型（如GPT-3、LLaMA等）的参数量达千亿级别，单卡GPU无法存储完整模型，在训练时，除了模型参数占用显存，梯度和优化器状态同样占用显存，因此有必要使用分布式的方式进行模型的训练和推理。此外，训练大模型需要海量计算（如GPT-3需数万GPU小时），分布式训练可加速训练过程。DeepSpeed之ZeRO系列：将显存优化进行到底特征张量并行 (Tensor Parallelism)ZeR

#人工智能 #深度学习

大模型的开发应用（十六）：Agent 与 LangGraph基础

Agent 在早几年被翻译成代理，但这与它的实际功能并不贴切，因此这两年称呼其为 “智能体” 比较多，它是指能自主感知环境、做出决策并执行动作以达成目标的实体，通过利用大语言模型的推理能力，能够自主对复杂的人类任务进行目标规划、任务拆解、工具调用、过程迭代，并在没有人类干预的情况下完成任务。Agent 的核心在于其自主性：无需人类全程操控，能主动解决问题。LangGraph 是一个由LangCha

#人工智能 #自然语言处理 #深度学习

大模型的开发应用（十三）：基于RAG的法律助手项目（上）：总体流程简易实现

本项目是制作一款专注于劳动纠纷的法律助手，使用RAG技术实现。

#人工智能 #自然语言处理

大模型的开发应用（三）：基于LLaMAFactory的LoRA微调

当前（2025.5），生成模型最常用的微调手段就是LoRA微调，它是局部微调的一种，而全量微调限于数据和算力等因素，很少去使用。LLaMA Factory 是一个简单易用且高效的大型语言模型（Large Language Model）训练与微调平台。模型种类：LLaMA、LLaVA、Mistral、Mixtral-MoE、Qwen、Yi、Gemma、Baichuan、ChatGLM、Phi 等几乎

#深度学习 #人工智能 #语言模型

共 23 条

请选择