logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

深入理解PPO算法:强化学习中的策略优化

强化学习(Reinforcement Learning, RL)作为机器学习的重要分支,旨在通过与环境的交互来学习最优策略,以最大化累积奖励。策略梯度方法是强化学习中的一种关键技术,它直接对策略进行参数化并利用梯度上升来优化期望奖励。策略梯度方法是强化学习中的一种模型,其核心思想是学习一个参数化的策略,该策略可以直接映射观察到的动作,而不是状态的价值。在给定状态下,策略直接决定采取的动作概率。-

概率统计matlab实验,概率论matlab实验报告

概率论matlab实验报告 概率论与数理统计 matlab 上机 实验报告 班级: 学号: 姓名: 指导老师:实验一 常见分布的概率密度 、分布函数生成 [实验目的] 1. 会利用 MATLAB 软件计算离散型随机变量的概率,连续型随机变量概率密度 值。 2.会利用 MATLAB 软件计算分布函数值,或计算形如事件{X ≤x}的概率。 3.会求上 α 分位点以及分布函数的反函数值。 [实验要求]

亲测bert-base-chinese镜像:智能客服文本分类效果实测

本文介绍了基于星图GPU平台自动化部署bert-base-chinese预训练模型镜像的实践过程,聚焦智能客服场景中的文本分类任务。通过该镜像可快速实现模型微调与推理,高效构建高精度工单分类系统,显著提升客服工单处理效率与准确性。

SenseVoice Small语音识别实战|一键部署获取文字+情感+事件标签

本文介绍了基于星图GPU平台自动化部署“SenseVoice Small根据语音识别文字和情感事件标签 二次开发构建by科哥”镜像的完整实践。该平台支持一键启动多任务语音理解服务,可高效实现语音转文本、情感分析与声学事件检测。典型应用于客服对话质量分析、视频内容智能打标及课堂情绪监测等场景,助力AI语音处理快速落地。

RexUniNLU在知识图谱构建中的应用:中文关系抽取与实体链接案例

本文介绍了如何在星图GPU平台上自动化部署RexUniNLU零样本通用自然语言理解-中文-base镜像,高效支撑中文知识图谱构建中的关系抽取与实体链接任务,例如从政策文本中自动识别‘企业-可上市板块-科创板’三元组并链接至标准知识库ID,显著降低标注成本与开发周期。

#知识图谱
PyTorch-CUDA-v2.7镜像训练ResNet50图像分类实测

基于pytorch-cuda:v2.7镜像,完整验证ResNet50在CIFAR-10上的迁移学习流程,涵盖环境配置、多卡训练、混合精度优化与容器化部署关键细节,实现开箱即用的高效图像分类训练。

Moodle 2.1.9:全面的开源在线学习管理系统

Moodle是一个开源的学习管理系统(LMS),自2002年由Martin Dougiamas开发以来,已经发展成为全球范围内众多教育机构和企业广泛使用的在线教育平台。Moodle这个词来自于Modular Object-Oriented Dynamic Learning Environment的缩写,其设计理念侧重于灵活性和可扩展性,为教师和学生提供了丰富多样的学习和教学工具。

升级Z-Image-Turbo后,图像生成速度提升3倍

本文介绍了如何在星图GPU平台上自动化部署集成Z-Image-Turbo文生图大模型(预置30G权重-开箱即用)镜像,实现毫秒级AI图像生成。依托平台优化的GPU资源调度与预热机制,用户可快速启动高分辨率文生图任务,典型应用于电商海报设计、社交媒体配图等高频视觉内容创作场景。

IAR使用教程:多芯片支持包安装说明

深入讲解IAR使用教程中多芯片支持包的安装步骤与常见问题,帮助开发者快速配置开发环境,提升项目开发效率。

小白必看!DeepSeek-R1保姆级安装教程,CPU也能跑大模型

本文介绍了基于星图GPU平台自动化部署🧠 DeepSeek-R1 (1.5B) - 本地逻辑推理引擎镜像的完整流程,支持在无GPU环境下通过CPU运行大模型。该镜像适用于教育辅助、编程助手及办公自动化等场景,用户可快速搭建本地AI推理服务,实现高效逻辑推理与交互式对话。

    共 80 条
  • 1
  • 2
  • 3
  • 8
  • 请选择