logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

腾讯混元翻译模型Hunyuan-MT-7B开源:小参数量大能量,获得30项国际冠军

腾讯开源轻量级翻译大模型Hunyuan-MT-7B,该模型在WMT2025机器翻译比赛中以7亿参数斩获30项冠军,支持33种语言互译。其创新在于:1)参数效率高,推理速度快30%;2)上下文理解强,能处理俚语、古诗等复杂文本;3)推出集成模型Hunyuan-MT-Chimera-7B,可组合多模型提升专业翻译准确率。目前该技术已应用于腾讯会议、企业微信等产品,服务超10万开发者。腾讯将持续开源优化

文章图片
#机器翻译#人工智能#自然语言处理 +1
腾讯混元世界模型Voyager开源:单图生成3D世界的“核弹级”突破,游戏、VR、自动驾驶迎来新变量

腾讯AI实验室开源HunyuanWorld-Voyager模型,实现单图秒级生成高质量3D点云,登顶WorldScore排行榜。该技术突破3D内容生成效率低、成本高的瓶颈,支持自由控制相机视角,生成连贯3D场景。应用场景涵盖游戏开发、VR/AR、数字孪生及机器人导航等领域,大幅降低创作门槛。作为腾讯AI开源战略的重要部分,该模型通过开源推动技术普惠,打破西方技术垄断,标志着3D内容生成进入&quo

文章图片
#3d#游戏#vr +2
全球首款Al勒索软件PromptLock:跨平台攻击新威胁, Windows/macOs/Linux均受影响

PromptLock的出现,标志着AI技术滥用正式进入勒索软件领域。这场攻防战没有终点,唯有技术迭代与安全意识提升双管齐下,才能守住数字世界的底线。未来,黑客与安全厂商的AI博弈,或将决定网络空间的最终格局。全球首款Al勒索软件PromptLock:跨平台攻击新威胁, Windows/macOs/Linux均受影响-AITOP100,AI资讯。

文章图片
#AIGC#人工智能
Nano Banana揭秘:Google Gemini 2.5 Flash Image正式发布 | AI图像编辑新时代

Google正式发布Gemini2.5FlashImage,揭开了此前在AI社区引发轰动的神秘模型"NanoBanana"的面纱。这款图像编辑器在盲测中展现出惊人的编辑效果和一致性表现,人脸保持度和风格一致性高达90-95%。核心优势包括自然语言编辑、一次性精准修改、角色一致性维护和多图像融合能力,适用于创意设计、广告营销等多个领域。目前可通过GoogleAIStudio和Ge

文章图片
#人工智能#AIGC
通义万相音频驱动视频模型Wan2.2-S2V重磅开源

阿里云通义万相团队发布革命性开源视频生成模型Wan2.2-S2V,该模型仅需图片+音频即可生成分钟级电影级数字人视频,支持多种形象类型和画幅。其创新性体现在:1)首度引入MoE双专家架构(270亿参数),分阶段优化视频生成;2)通过层次化帧压缩技术实现长视频稳定生成;3)支持文本精准控制和多分辨率输出。同时通义千问开源20B图像生成模型Qwen-Image,在复杂文本渲染方面表现优异。在全球AI视

文章图片
#音视频#开源#人工智能 +1
谷歌Imagen4上线:三版本齐发,文本转图像卷出新高度!

谷歌推出全新文本转图像模型Imagen4,提供标准版、Fast版和Ultra版三个版本,满足不同场景需求。标准版提升整体质量,Fast版优化生成速度,Ultra版注重细节还原。该技术将大幅提升创意产业效率,降低行业门槛。目前可通过谷歌官方平台体验,未来将持续优化AI图像生成技术。

文章图片
#人工智能#AIGC
Nano Banana AI深度实测教程:Google神秘武器如何重新定义图像编辑标准

NanoBanana:AI图像编辑领域的隐形冠军 这款尚未正式发布的AI工具在LMArena平台随机出现,被普遍认为是Google的秘密项目。测试数据显示,NanoBanana在面部一致性(95%+)、首次成功率(90%)和处理速度(2分钟内)方面远超主流模型,可实现人物造型变换、快速PS等复杂操作。通过LMArena.ai的盲测对战系统,用户可体验其将照片转化为手办、更换服装背景等强大功能。其卓

文章图片
#人工智能#AIGC
通义万相国际版wan2.2开源第4天-镜头运动

通义万相国际版wan2.2在开源第四天推出镜头运动功能,让用户轻松实现专业级运镜效果。基础款包括推拉、移动和倾斜镜头,适合表现情绪和环境;进阶玩法提供追踪、绕圈和复合运动,能增强代入感和画面质感。用户反馈显示,简单的json提示符即可拍出惊艳效果,虽然有人期待更高级架构,但现有功能已满足多数创作需求。该功能让普通人无需专业设备也能拍出电影感画面,是视频创作的实用工具。

文章图片
#人工智能#AIGC
实测:我让AI点了杯咖啡,还叫了车!全球首个手机通用Agent-AutoGLM 2.0到底多聪明?

智谱AutoGLM2.0推出全球首个手机通用Agent,通过云手机模拟操作实现"一句话办事"。相比初代产品,2.0版本采用双设备架构和自研GLM-4.5系列模型,支持全平台操作,既保证安全性又提升通用性。实测显示AI能完成点咖啡、打车等任务,但关键决策仍需用户确认。该技术突破国产Agent依赖海外模型的困境,执行成本仅为0.2美元/次,标志着AI助理进入实用化阶段,有望实现&q

文章图片
#人工智能#AIGC
ComfyUI重磅更新:AI助手Copilot V2上线,一句话就能搞定工作流!

AI绘图工具ComfyUI推出CopilotV2智能助手,实现"用嘴调工作流"的革命性突破。该工具支持语音指令生成/修改工作流、自动查错修复、智能节点推荐等功能,并能适配本地环境。技术亮点包括多模态理解、环境感知和强大错误数据库。这一更新将工作流搭建时间缩短70%,大幅降低使用门槛,标志着AI正从辅助工具进化为创作伙伴,让用户更专注于创意而非技术细节。

文章图片
#人工智能#copilot#AIGC
    共 27 条
  • 1
  • 2
  • 3
  • 请选择