
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
MiniCPM-V 4.5 是 OpenBMB 最新 8B 多模态大模型,基于 Qwen3-8B + SigLIP2-400M,在 OpenCompass 平均 77.0 分,超越 GPT-4o-latest 与 Qwen2.5-VL 72B;独创 3D 重采样器实现 96× 视频令牌压缩,10 FPS 长视频理解不增成本;可控混合快速/深度思维一键切换;180 万像素 OCR 与 PDF 解析领

MiniCPM-V 4.5 是 OpenBMB 最新 8B 多模态大模型,基于 Qwen3-8B + SigLIP2-400M,在 OpenCompass 平均 77.0 分,超越 GPT-4o-latest 与 Qwen2.5-VL 72B;独创 3D 重采样器实现 96× 视频令牌压缩,10 FPS 长视频理解不增成本;可控混合快速/深度思维一键切换;180 万像素 OCR 与 PDF 解析领

硬件升级引领,AI 功能作为辅助角色——苹果AI仍然向务实渐进。

OpenAI与博通合作研发的AI芯片将于2026年开始量产。

HunyuanVideo-Foley 是腾讯混元团队在2025年8月底开源的一款。它旨在解决AI生成视频“有画无声”的痛点,通过输入视频和文本描述,就能自动生成的同步音效,显著提升视频的沉浸感。它是专为视频内容创作者设计的专业级 AI 工具,广泛适用于短视频创作、电影制作、广告创意、游戏开发等多种场景。

智能体爆发元年,DeepSeek也要入局了?

OpenAI发布《在AI时代保持领先:领导力指南》,提出五大原则帮助企业应对AI时代的挑战。

Qwen-Image 是阿里巴巴通义千问团队于 2025 年 8 月开源的首个图像生成基础模型,也是目前在复杂文本(尤其是中文)渲染方面表现最好的开源文生图大模型之一。这是一个 20B MMDiT 图像基础模型,在复杂文本渲染和精确图像编辑方面取得了重大进步。性能表现上,在多个公开基准上的对 Qwen-Image 的全面评估,包括用于通用图像生成的 GenEval、DPG 和 OneIG-Benc

调用vllm 启动的模型服务接口实现:通过openai 接口调用vllm 服务,实现图像和视频输入(以关键帧的形式);输入视频时对于关键帧的调整,默认是自动根据视频时长调整关键帧数;模型连接状态展示。import osimport re# --- OpenAI客户端配置 ---openai_api_base = "http://localhost:8000/v1" # 修改为你的API服务器地址#

a16z最新公布的全球AI应用榜单显示,中国AI力量正在强势崛起,移动端Top 50产品中接近一半来自中国。
