logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

为机器学习算法准备数据(Machine Learning 研习之八)

在为机器学习算法准备数据之前,您可能需要做的最后一件事是尝试各种属性组合。例如,如果你不知道一个地区有多少住户,那么这个地区的房间总数就不是很有用。你真正想要的是每个家庭的房间数量。同样,卧室总数本身也不是很有用:你可能想对比一下房间的数量。

文章图片
#机器学习#算法#人工智能 +1
本地部署Qwen2.5-VL-7B-Instruct多模态视觉大模型(Windows篇)

Qwen2.5-VL是阿里云推出的开源多模态大模型,支持等功能。较上一个版本Qwen2-VL有质的飞越,Qwen2.5-VL通过动态分辨率适配和窗口注意力机制,显著降低显存占用并提升推理速度,72B模型在单卡A100上推理速度提升30%。身在AI这股浪潮中,只要本地电脑硬件条件允许的话,我都会尝试着去部署优秀的开源大模型。说到开源大模型,相对而言的就是闭源大模型,我们在脑海中很自然地浮现出国外的O

文章图片
#pytorch
现实生活中机器学习的具体示例(Machine Learning 研习之二)

这些算法尝试保留尽可能多的结构(例如,尝试保持输入空间中的单独簇在可视化中不重叠),以便您可以了解数据的组织方式,并可能识别出意想不到的模式。它可能会注意到,40% 的访问者是喜欢漫画书并通常在放学后阅读您的博客的青少年,而 20% 是喜欢科幻小说并在周末访问的成年人。的一个分支,训练代理(例如机器人)来选择随着时间的推移最大化其奖励的操作(例如,机器人可能会获得奖励) 每当玩家在给定环境(例如游

文章图片
#机器学习#人工智能
端到端的机器学习项目(Machine Learning 研习之六)

最后,没有连续的数据流进入系统,没有特别的需要来适应快速变化的数据,数据足够小,可以放入内存中,所以普通的批处理学习应该做得很好。这是事实,但你的大脑是一个令人惊奇的模式检测系统,这也意味着它很容易过度拟合:如果你查看测试集,你可能会在测试数据中偶然发现一些看似有趣的模式,从而引导你选择 一种特殊的机器学习模型。如您所见,使用分层抽样生成的测试集的收入类别比例几乎与完整数据集中的收入类别比例相同,

文章图片
#机器学习#人工智能
Comfyui加载图像编辑Qwen-Image-Edit工作流之Windows篇

阿里巴巴开源图像编辑大模型Qwen-Image-Edit,基于20B参数的Qwen-Image开发,支持精准文字编辑(增删改中英文字)、语义/外观双重编辑(风格迁移、IP制作等)。模型在多个基准测试中表现优异,国内用户可通过镜像下载。安装需将模型文件放入ComfyUI对应目录,使用最新版ComfyUI加载工作流即可实现高质量图像编辑,实测能完美去除图片水印。

文章图片
#ComfyUI#工作流
文生音乐开源项目DiffRhythm,8G显存本地部署之Windows篇

DiffRhythm是由西北工业大学音频语音与语言处理实验室(ASLP@NPU)与香港中文大学(深圳)联合开发的开源音乐生成模型,其采用**全扩散架构**,能够在**10秒内生成4分45秒**的高质量双轨立体声音乐(包含人声与伴奏) 。该模型以**非自回归结构**实现极速推理,支持纯文字风格描述生成音乐(如"Jazzy Nightclub Vibe"或"Arctic research statio

文章图片
#pytorch#深度学习#AI
Windows 结合最新版 ComfyUI 部署阿里最新开源的 Qwen-Image 图像大模型

阿里巴巴开源Qwen-Image模型,解决了AI绘画中文文本渲染问题。本文详细介绍在Windows系统下基于ComfyUI部署Qwen-Image工作流的方法,包括安装/更新ComfyUI、下载模型文件、加载工作流等步骤。通过示例展示模型生成中文文本图像的能力,并介绍如何结合Lora模型实现写实风格效果。文章还提供了相关资源链接和参数调整建议,帮助用户获得更好的生成效果。

文章图片
#ComfyUI
本地部署Qwen2.5-VL-7B-Instruct多模态视觉大模型(Windows篇)

Qwen2.5-VL是阿里云推出的开源多模态大模型,支持等功能。较上一个版本Qwen2-VL有质的飞越,Qwen2.5-VL通过动态分辨率适配和窗口注意力机制,显著降低显存占用并提升推理速度,72B模型在单卡A100上推理速度提升30%。身在AI这股浪潮中,只要本地电脑硬件条件允许的话,我都会尝试着去部署优秀的开源大模型。说到开源大模型,相对而言的就是闭源大模型,我们在脑海中很自然地浮现出国外的O

文章图片
#pytorch
机器学习的测试和验证(Machine Learning 研习之五)

在此保留验证过程之后,您可以在完整的训练集(包括验证集)上训练最佳模型,这将为您提供最终模型。在这种情况下,需要记住的最重要的规则是,验证集和测试集都必须尽可能具有生产中预期使用的数据的代表性,因此它们应该完全由有代表性的图片组成:您可以对它们进行洗牌,将一半放在验证集中,另一半放在测试集中(确保在这两个集合中都没有重复或接近重复的数据)。在网络图片上对模型进行培训之后,如果您观察到模型在验证集上

文章图片
#机器学习#人工智能#神经网络
国内 gitee.com Pages 下线了,致使众多站长纷纷改用 github、gitlab Pages 托管平台

作为一位IT或coder(码农、程序员),在日常工作中,多多少少都会有技术知识的积累(生产环境中所遇到的问题【亦可称为是坑】)。俗话说得好,好记性抵不过烂笔头。不管是前沿技术的研习后的心得,还是工作中所遇到的问题,亟需将这些笔记留存下来,为的是以备后续查看(未来有可能遇到类似的坑,也好该如何下手,以不至于手忙脚乱的),当然咯,在方便自己的同时,也分享给他人。那既然只是为了留存笔记而已,又何必去搭建

文章图片
    共 44 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择