logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

DeepSeek-VL2实战指南:一步步构建您自己的智能视觉问答系统!

DeepSeek-VL2,这是一系列先进的大型混合专家 (MoE) 视觉语言模型,其显著改进了其前身 DeepSeek-VL。DeepSeek-VL2 在各种任务中都表现出卓越的能力,包括但不限于视觉问答、光学字符识别、文档/表格/图表理解和视觉基础。我们的模型系列由三个变体组成:DeepSeek-VL2-Tiny、DeepSeek-VL2-Small 和 DeepSeek-VL2,分别具有 1.

文章图片
#人工智能#python#算法 +2
DeepSeek 创新力作—— Janus-Pro 本地部署教程 ,解锁多模态 AI 新境界!

Janus-Pro 是由 DeepSeek 推出的一种新颖的自回归框架,它将多模态理解和生成统一起来。通过将视觉编码解耦为单独的路径来解决以前方法的局限性,同时使用单一、统一的转换器架构进行处理。这种解耦不仅缓解了视觉编码器在理解和生成中的角色冲突,还增强了框架的灵活性。Janus-Pro 超越了之前的统一模型,并且达到或超过了特定任务模型的性能。凭借简单性、高灵活性和有效性,Janus-Pro

文章图片
#人工智能
Fish-Speech 部署教程:15 秒克隆声音,多语种随心畅言

凭借15秒音频样本克隆声音,支持多语种的Fish-Speech开源TTS模型来啦!融合VQ-GAN、Llama 与VITS前沿技术,依托Transformer 架构,开启语音合成新篇!快跟着小编快速搭建吧~

文章图片
YOLOv12本地部署教程——42%速度提升,让高效目标检测触手可及

YOLOv12 是“你只看一次”(You Only Look Once, YOLO)系列的最新版本,于 2025 年 2 月发布。它引入了注意力机制,提升了检测精度,同时保持了高效的实时性能。在保持速度的同时,显著提升了检测精度。例如,YOLOv12-N 在 T4 GPU 上的推理延迟为 1.64 毫秒,平均精度(mAP)达到 40.6%,相比 YOLOv10-N 和 YOLOv11-N 分别提升

文章图片
#人工智能
基于Langchain-Chatchat + ChatGLM 本地部署知识库

基于Langchain - Chatchat 与 ChatGLM的本地部署知识库来啦!保障数据隐私,定制知识体系,重塑知识交互体验 。快跟着小编快速搭建吧~

文章图片
打造哪吒 3D 爆款!Direct3D本地部署教程 :解锁逼真视觉效果的 3D 生成模型

快用 Direct3D 解锁逼真视觉效果的 3D 模型,打造哪吒 3D 爆款吧

文章图片
#人工智能
在Ubuntu 22.04 极速安装 MongoDB Community Edition:新手必看指南

MongoDB 社区版是 MongoDB 的免费开源版本,提供核心 NoSQL 数据库功能,支持文档存储、索引、复制、分片等,适合开发测试和小规模生产环境。核心优势包括灵活的数据模型、横向扩展能力及活跃的社区支持等,适用于初创团队、教育用途及轻量级应用场景。二、

文章图片
#ubuntu#mongodb#linux +2
stable-zero123模型构建指南

Stable-Zero123 是由 stability.ai 推出的一款极具创新性的模型。它能够针对具有简单背景的物体进行三维视角图片的生成,通过巧妙地调整和变换观察视角,该模型可以精准地生成对应视角的图片,为用户带来全新的视觉体验。

文章图片
#GPU#人工智能#AIGC
Manus即将推出中文版!与DeepSeek的“左右互搏”,谁能定义AI的未来?

昨天,Manus官宣与阿里通义千问达成合作,即将推出中文版,预计对广大用户开放使用。之前饱受争议的Manus,能超越DeepSeek吗?谁能定义AI的未来?

文章图片
#人工智能
低成本抗衡DeepSeek-R1!阿里重磅开源QwQ-32B,推理模型的“降维打击”来了!

3月6日,阿里宣布开源推理模型 QwQ-32B,320亿参数却实现了与 DeepSeek-R1 满血版相匹敌的性能,甚至在多项测试中实现了超越。这一突破打破了“参数规模决定性能”的固有认知,将推理能力提升至新的高度。 

文章图片
#开源#人工智能
    共 38 条
  • 1
  • 2
  • 3
  • 4
  • 请选择