logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Colossal-AI 中文版 LLaMA-2:低成本、高性能的人工智能模型解决方案

🎉 总之,Colossal-AI 团队发布的中文版 LLaMA-2 是一个性能卓越的开源大模型,它不仅降低了大模型的训练成本,提高了模型的性能,还为开发者和企业提供了一个低成本、可复现的大模型解决方案。👀 近日,Colossal-AI 团队发布了中文版 LLaMA-2,这是一个基于 LLaMA-2 的开源大模型,旨在降低大模型的训练成本,提高模型的性能。未来,Colossal-AI 团队将继续

文章图片
#人工智能#语言模型
Z-Image:无需登录、无需注册的免费AI图像生成工具深度评测

《无需登录的AI图像生成工具Z-Image评测》摘要 Z-Image是一款无需注册登录、完全免费的AI图像生成工具(https://zimage.run),采用基于SD3架构优化的Z-ImageTurbo模型,仅需4步采样即可30-60秒内生成图像。核心优势包括:1)真正零门槛使用体验;2)透明队列管理系统;3)支持最长10,000字符提示词和自定义尺寸;4)基于ComfyUI的技术架构确保稳定性

文章图片
#人工智能#开源#语言模型 +1
YOLOv10开源,高效轻量实时端到端目标检测新标准,速度提升46%

实时目标检测在自动驾驶、机器人导航、物体追踪等领域应用广泛,近年来,YOLO 系列模型凭借其高效的性能和实时性,成为了该领域的主流方法。但传统的 YOLO 模型通常采用非极大值抑制 (NMS) 进行后处理,这会增加推理延迟,阻碍了其端到端部署的应用。此外,现有的 YOLO 模型在架构设计方面也存在着一些局限性,例如计算冗余、参数利用率低等问题,这些问题限制了模型的性能和效率。Huggingface

文章图片
#目标检测#目标跟踪
仅凭视频输入,30秒生成物理正确3D布局!群核科技开源空间理解模型SpatialLM

SpatialLM作为一款开源空间智能模型,具备处理多源三维数据并生成结构化场景理解结果的能力,在具身智能等领域具有广阔前景]。其开源特性将促进社区的共同发展,加速空间智能技术的创新和应用。

文章图片
#3d#科技
英伟达发布 VILA 视觉语言模型,实现多图像推理、增强型上下文学习,性能超越 LLaVA-1.5

近年来,大型语言模型 (LLM) 的发展取得了显著的成果,并逐渐应用于多模态领域,例如视觉语言模型 (VLM)。VLM 旨在将 LLM 的强大能力扩展到视觉领域,使其能够理解和处理图像和文本信息,并完成诸如视觉问答、图像描述生成等任务。然而,现有的 VLM 通常缺乏对视觉语言预训练过程的深入研究,导致模型在多模态任务上的性能和泛化能力受限。

文章图片
#语言模型#学习#人工智能 +4
Sora视频水印终极解决方案:这款AI工具让你实现精准去除、高清无痕!

Sora2WatermarkRemover工具为AI视频创作者提供了专业级去水印解决方案。该工具通过"手动蒙版+AI智能修复"技术,支持用户精准标记水印区域,利用ComfyUI引擎智能填充内容,在保持原画质的同时完美去除水印。操作简单仅需"上传-框选-提交"三步,适用于影视制作、社交媒体创作等场景,为Sora视频的商业应用扫清障碍。云端处理不占用本地资源,是

文章图片
#人工智能#音视频
双卡 RTX 5090 深度体验:AI 推理框架选择与性能限制实测

本次双 RTX 5090 的深度体验为我们带来了不少有价值的信息。硬件本身性能强大,双卡并行潜力巨大,但务必重视散热方案和电源配置,以确保稳定运行。在推理框架选择上,Ollama 是当前最方便、开箱即用的选择,适合快速上手和实验。需要特别注意的是,像 SGLang 和 vLLM 这类广泛用于高并发、低延迟生产环境的推理框架,目前对 RTX 5090 的官方支持存在明显滞后。SGLang 因 CUD

文章图片
#人工智能#开源#服务器
多模态大模型CogVLM:智谱AI的新篇章

整体性能超越或匹配谷歌的PaLI-X 55B。CogVLM-17B模型在多模态权威学术榜单上取得了综合成绩第一的成绩,在14个数据集上取得了state-of-the-art或者第二名的成绩。此外,为了减少模型的幻觉现象,CogVLM通过特定的微调和更大的参数量,显著降低了幻觉出现的频次。该模型使用了5B参数的视觉编码器和6B参数的视觉专家模块,总共11B参数建模图像特征,这甚至多于文本的7B参数量

文章图片
#人工智能#深度学习#计算机视觉
阿里首个MoE大模型Qwen1.5 MoE A2.7B:27亿参数MoE性能媲美70亿参数,推理速度提升74%

近期,阿里巴巴宣布开源其首个MoE(混合专家)技术大模型——Qwen1.5-MoE-A2.7B,这标志着阿里在人工智能领域的又一重大进展。Qwen1.5-MoE-A2.7B不仅在技术上有所创新,更在性能上实现了突破,其27亿参数的MoE模型在多个基准测试中的性能可以媲美传统的70亿参数模型,同时推理速度提升达到74%。Huggingface模型下载:QwenAI快站模型免费加速下载:Qwen。

文章图片
#数据库#人工智能#gpt-3
阿里发布最强开源大模型通义千问Qwen2,国产最好用的LLM

近年来,大模型技术发展迅速,开源模型的出现为AI研究和应用带来了新的活力。在这一背景下,阿里云通义千问团队发布了全新升级的Qwen2系列开源模型,为国内外开发者提供了更强大的工具和更丰富的选择。Huggingface模型下载:AI快站模型免费加速下载:QwenQwen2的发布标志着阿里在开源大模型领域的又一次重要突破,展现了其在模型研发和应用方面的领先实力。

文章图片
#人工智能#深度学习#开源 +1
    共 149 条
  • 1
  • 2
  • 3
  • 15
  • 请选择