logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

面壁智能开源多模态大模型——MiniCPM-V 4.5本地部署教程:8B参数开启多模态“高刷”时代!

MiniCPM-V 4.5 是 OpenBMB 最新 8B 多模态大模型,基于 Qwen3-8B + SigLIP2-400M,在 OpenCompass 平均 77.0 分,超越 GPT-4o-latest 与 Qwen2.5-VL 72B;独创 3D 重采样器实现 96× 视频令牌压缩,10 FPS 长视频理解不增成本;可控混合快速/深度思维一键切换;180 万像素 OCR 与 PDF 解析领

文章图片
面壁智能开源多模态大模型——MiniCPM-V 4.5本地部署教程:8B参数开启多模态“高刷”时代!

MiniCPM-V 4.5 是 OpenBMB 最新 8B 多模态大模型,基于 Qwen3-8B + SigLIP2-400M,在 OpenCompass 平均 77.0 分,超越 GPT-4o-latest 与 Qwen2.5-VL 72B;独创 3D 重采样器实现 96× 视频令牌压缩,10 FPS 长视频理解不增成本;可控混合快速/深度思维一键切换;180 万像素 OCR 与 PDF 解析领

文章图片
不止高刷!苹果发布会AI功能全面解析:实时翻译、健康监测重磅升级

硬件升级引领,AI 功能作为辅助角色——苹果AI仍然向务实渐进。

文章图片
#人工智能
OpenAI百亿美元造芯计划曝光,算力争夺战进入新阶段?

OpenAI与博通合作研发的AI芯片将于2026年开始量产。

文章图片
#人工智能
腾讯最新开源HunyuanVideo-Foley本地部署教程:端到端TV2A框架,REPA策略+MMDiT架构,重新定义视频音效新SOTA!

HunyuanVideo-Foley 是腾讯混元团队在2025年8月底开源的一款。它旨在解决AI生成视频“有画无声”的痛点,通过输入视频和文本描述,就能自动生成的同步音效,显著提升视频的沉浸感。它是专为视频内容创作者设计的专业级 AI 工具,广泛适用于短视频创作、电影制作、广告创意、游戏开发等多种场景。

文章图片
#音视频#人工智能
DeepSeek被曝年底推出AI智能体,下一代人机交互时代要来了?

​​​​​​​智能体爆发元年,DeepSeek也要入局了?

文章图片
#人工智能
AI 时代如何保持领先?OpenAI 发布最新白皮书:五大原则助力企业破局

OpenAI发布《在AI时代保持领先:领导力指南》,提出五大原则帮助企业应对AI时代的挑战。

文章图片
#人工智能#生成式AI
阿里开源首个图像生成基础模型——Qwen-Image本地部署教程,中文渲染能力刷新SOTA

Qwen-Image 是阿里巴巴通义千问团队于 2025 年 8 月开源的首个图像生成基础模型,也是目前在复杂文本(尤其是中文)渲染方面表现最好的开源文生图大模型之一。这是一个 20B MMDiT 图像基础模型,在复杂文本渲染和精确图像编辑方面取得了重大进步。性能表现上,在多个公开基准上的对 Qwen-Image 的全面评估,包括用于通用图像生成的 GenEval、DPG 和 OneIG-Benc

文章图片
多模态融合新纪元:Ovis2.5 本地部署教程,实现文本、图像与代码的深度协同推理

调用vllm 启动的模型服务接口实现:通过openai 接口调用vllm 服务,实现图像和视频输入(以关键帧的形式);输入视频时对于关键帧的调整,默认是自动根据视频时长调整关键帧数;模型连接状态展示。import osimport re# --- OpenAI客户端配置 ---openai_api_base = "http://localhost:8000/v1" # 修改为你的API服务器地址#

文章图片
#人工智能
全球AI百强榜发布!中国产品占据移动端半壁江山

a16z最新公布的全球AI应用榜单显示,中国AI力量正在强势崛起,移动端Top 50产品中接近一半来自中国。

文章图片
#人工智能
    共 162 条
  • 1
  • 2
  • 3
  • 17
  • 请选择