logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Audiocraft智能音频和音乐生成工具部署及使用

Facebook开源了一款名为AudioCraft的AI音频和音乐生成工具。该工具可以直接从文本描述和参考音乐生成高质量的音频和音乐。AudioCraft包含MusicGen、AudioGen和EnCodec三个模型,分别实现音乐生成、音频生成和自定义音频模型构建。

文章图片
#音视频
Transformer推理揭秘:Prefill阶段的QKV并行计算与KV Cache的真相

大语言模型推理包含Prefill和Decode两个阶段。Prefill阶段利用GPU并行计算能力,通过矩阵乘法一次性处理完整Prompt序列,实现QKV向量计算、注意力分数计算和信息聚合的高度并行化。而KVCache不能复用是因为每个Token的向量表示会随上下文层层进化,最终存储的是经过多层网络加工后的特定语境状态。

#transformer#人工智能#深度学习
RLHF&DPO原理从入门到精通

本文系统介绍了基于人类反馈的强化学习(RLHF)技术框架。主要内容包括:1)RLHF数据格式,包含prompt、优质回答(chosen)和劣质回答(rejected)的成对偏好数据;2)奖励模型训练方法,通过Bradley-Terry损失函数学习人类偏好排序;3)PPO算法原理,通过策略裁剪和KL惩罚实现稳定优化;4)DPO算法创新,直接利用偏好数据优化模型而无需复杂强化学习流程。文章详细阐述了从

#人工智能
Vue第六篇:电商网站图片放大镜功能

2)mousemove:鼠标移动时,鼠标的遮罩块区域跟着移动,同时放大镜区域的图片跟着切换(显示遮罩块的放大效果)(1)商品图区域:主要是浏览图片,根据图片的url显示图片。当鼠标离开此区域时"放大镜区域"不需要显示。放大镜区域其实放着一个大图,当鼠标在商品图区域移动时,放大镜区域的大图相向移动。1)mouseenter:鼠标进入时,放大镜区域根据url显示图片。(3)商品图总览:鼠标over时,

文章图片
#vue.js#前端#javascript
LangChain调用tool集的原理剖析(包懂)

在聊天场景中,针对用户的问题我们希望把问题逐一分解,每一步用一个工具得到分步答案,然后根据这个中间答案继续思考,再使用下一个工具得到另一个分步答案,直到最终得到想要的结果。这个场景非常匹配langchain工具。在langchain中,我们定义好很多工具,每个工具对解决一类问题。然后针对用户的输入,langchain会不停的思考,最终得到想要的答案。

文章图片
#机器学习
Unity3d动画插件DoTween使用指南

DoTween是一款对象动画类插件,它是一款针对Unity 3D编辑器的、快速高效的、安全的、面向对象的补间动画引擎,并且对C#语言开发做出了很多的优化。另外,它使得开发者无需通过Unity内置的Animator或Coroutines即可创建流畅、灵活的动画效果。

文章图片
#unity#游戏
京东agent之joyagent解读

京东agent之JoyAgent解读

文章图片
#人工智能
redis-stack部署安装使用说明

第三步,编辑etc下的redis-stack-service.conf文件。第二步,redis安装包解压缩。

文章图片
#redis#数据库#缓存
Yolo指标解读

摘要:本文系统介绍了目标检测中的关键评估指标。首先解析混淆矩阵中的TP、FP、FN、TN概念及其实际含义;其次阐述准确率(衡量预测正样本的准确性)和召回率(衡量检出真实正样本的完整性)的计算方法;然后详细说明IoU(交并比)的定义及其对TP/FP判定的影响机制,包括定位和类别的双重考核标准;最后对比mAP50(IoU阈值为0.5)和mAP50-95(IoU阈值0.5-0.95范围平均)两个指标的区

文章图片
#python#人工智能
Triton编程技术指南

摘要:OpenAI Triton是一种开源的类Python编程语言和编译器,专为GPU并行计算设计。其核心概念Program相当于CUDA中的线程块,自动处理线程调度和并行化。Triton提供高效的内存访问优化、边界检查机制和JIT即时编译功能,支持TMA硬件加速和持久化内核设计。关键特性包括:1)基于Block粒度的编程模型;2)自动并行化处理;3)L1/L2缓存优化;4)TMA硬件加速数据传输

#算法
    共 61 条
  • 1
  • 2
  • 3
  • 7
  • 请选择