
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
DeepSeek-VL2,这是一系列先进的大型混合专家 (MoE) 视觉语言模型,其显著改进了其前身 DeepSeek-VL。DeepSeek-VL2 在各种任务中都表现出卓越的能力,包括但不限于视觉问答、光学字符识别、文档/表格/图表理解和视觉基础。我们的模型系列由三个变体组成:DeepSeek-VL2-Tiny、DeepSeek-VL2-Small 和 DeepSeek-VL2,分别具有 1.

Janus-Pro 是由 DeepSeek 推出的一种新颖的自回归框架,它将多模态理解和生成统一起来。通过将视觉编码解耦为单独的路径来解决以前方法的局限性,同时使用单一、统一的转换器架构进行处理。这种解耦不仅缓解了视觉编码器在理解和生成中的角色冲突,还增强了框架的灵活性。Janus-Pro 超越了之前的统一模型,并且达到或超过了特定任务模型的性能。凭借简单性、高灵活性和有效性,Janus-Pro

凭借15秒音频样本克隆声音,支持多语种的Fish-Speech开源TTS模型来啦!融合VQ-GAN、Llama 与VITS前沿技术,依托Transformer 架构,开启语音合成新篇!快跟着小编快速搭建吧~

YOLOv12 是“你只看一次”(You Only Look Once, YOLO)系列的最新版本,于 2025 年 2 月发布。它引入了注意力机制,提升了检测精度,同时保持了高效的实时性能。在保持速度的同时,显著提升了检测精度。例如,YOLOv12-N 在 T4 GPU 上的推理延迟为 1.64 毫秒,平均精度(mAP)达到 40.6%,相比 YOLOv10-N 和 YOLOv11-N 分别提升

基于Langchain - Chatchat 与 ChatGLM的本地部署知识库来啦!保障数据隐私,定制知识体系,重塑知识交互体验 。快跟着小编快速搭建吧~

快用 Direct3D 解锁逼真视觉效果的 3D 模型,打造哪吒 3D 爆款吧

MongoDB 社区版是 MongoDB 的免费开源版本,提供核心 NoSQL 数据库功能,支持文档存储、索引、复制、分片等,适合开发测试和小规模生产环境。核心优势包括灵活的数据模型、横向扩展能力及活跃的社区支持等,适用于初创团队、教育用途及轻量级应用场景。二、

Stable-Zero123 是由 stability.ai 推出的一款极具创新性的模型。它能够针对具有简单背景的物体进行三维视角图片的生成,通过巧妙地调整和变换观察视角,该模型可以精准地生成对应视角的图片,为用户带来全新的视觉体验。

昨天,Manus官宣与阿里通义千问达成合作,即将推出中文版,预计对广大用户开放使用。之前饱受争议的Manus,能超越DeepSeek吗?谁能定义AI的未来?

3月6日,阿里宣布开源推理模型 QwQ-32B,320亿参数却实现了与 DeepSeek-R1 满血版相匹敌的性能,甚至在多项测试中实现了超越。这一突破打破了“参数规模决定性能”的固有认知,将推理能力提升至新的高度。
