logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

OpenAI开放ChatGPT Projects功能,免费用户也能用了!

OpenAI宣布向所有免费用户开放ChatGPT Projects功能,这一智能化工作空间允许用户创建专属对话文件夹,支持自定义指令、文件上传(免费用户5个)和结构化管理。新增的"Project-only Memory"功能增强了数据隐私,而个性化定制进一步优化了用户体验。此次更新深化了OpenAI的Freemium模式,在扩大用户基础的同时保障隐私安全。未来还将支持iOS平台

文章图片
#人工智能#AIGC
阿里开源Vivid-VR:AI视频修复新标杆,解锁内容创作新可能

**摘要:**阿里云开源AI视频修复工具Vivid-VR,结合T2V与ControlNet技术,有效解决传统修复中的闪烁、抖动问题,提升帧间一致性。该工具支持真实视频和AI生成内容,适用于短视频、影视后期等场景。已在Hugging Face、GitHub等平台开源,降低技术门槛,赋能全球创作者。项目地址:https://github.com/csbhr/Vivid-VR

文章图片
#开源#vr#人工智能
超长视频生成新突破!LongVie框架问世,创作不再受时长限制

摘要: 上海人工智能实验室联合多所顶尖机构推出LongVie框架,突破超长视频生成技术瓶颈。该框架通过全局归一化控制信号和统一噪声初始化,有效解决长视频的时序不一致和视觉退化问题,并引入多模态精细控制方法保持画质稳定。团队还发布了首个超长视频生成基准数据集LongVGenBench,评测显示LongVie达到SOTA水平。这一技术为AI视频创作打破时长限制,开启全新可能。(149字)

文章图片
#人工智能
超长视频生成新突破!LongVie框架问世,创作不再受时长限制

摘要: 上海人工智能实验室联合多所顶尖机构推出LongVie框架,突破超长视频生成技术瓶颈。该框架通过全局归一化控制信号和统一噪声初始化,有效解决长视频的时序不一致和视觉退化问题,并引入多模态精细控制方法保持画质稳定。团队还发布了首个超长视频生成基准数据集LongVGenBench,评测显示LongVie达到SOTA水平。这一技术为AI视频创作打破时长限制,开启全新可能。(149字)

文章图片
#人工智能
Vercel v0 iOS版重磅发布:AI驱动的移动开发新篇章

Vercel v0 iOS版正式发布,将AI驱动的开发体验扩展到移动端。该工具通过自然语言提示快速生成UI和代码,支持React/Next.js框架,现推出一键创建移动应用功能。iOS版延续了"Anything.Anyone.Anywhere"理念,使各水平开发者都能随时随地构建应用。目前开放候补名单注册,标志着AI开发工具正从Web向移动生态拓展,或将重塑移动开发流程。

文章图片
#ios#人工智能#AI
AI图片生成器:40秒极速出图,你的创意灵感库!

今天,我们将为您详细介绍一款强大的AI图片免费生成器——这款在线工具旨在帮助所有创意工作者,以最快的速度将想法变为现实,承诺在内为您生成专业级图像。

文章图片
#人工智能#AIGC#AI作画
Read Frog:一款开源AI浏览器语言学习扩展

摘要: Read Frog(陪读蛙)是一款开源AI浏览器扩展,通过沉浸式双语翻译和智能内容提取功能,将网页浏览转化为语言学习体验。该工具支持OpenAI和DeepSeek模型,提供划词翻译、语境解释等功能,帮助用户高效学习外语。适用于语言学习者、外语读者和教育工作者,未来将扩展选区翻译、生词本、语音讲解等功能。目前可在GitHub和官网获取。(149字)

文章图片
#人工智能#学习
Poixe AI 上线 Kimi K2 模型,支持 API 调用

Kimi K2是Moonshot AI开源的1万亿参数稀疏MoE架构模型,支持128K上下文和复杂Agent任务。文章详细介绍了通过Poixe AI内置工具或Cherry Studio客户端调用该模型的方法,并对比了Poixe AI与传统平台的价格优势。该模型在编程、数学等任务中表现优异,已接入多个开发平台。

文章图片
#AIGC#语言模型
字节跳动重磅开源VeOmni框架:多模态训练效率提升40%以上的新利器!

字节跳动开源VeOmni多模态训练框架,支持文本、图像、视频等多种模型训练,通过统一并行策略和算力底座,实现训练吞吐量提升40%以上。该框架包含显存优化、多维并行和蒸馏加速等技术创新,显著提升训练效率。VeOmni的开源将推动多模态AI技术发展,为研究者和开发者提供强大工具。

文章图片
#开源
小米重磅开源!最新多模态大模型MiMo-VL-7B-2508性能全面刷新纪录

小米开源新一代多模态大模型MiMo-VL-7B-2508,包含强化学习(RL)和监督微调(SFT)两个版本。该模型在多模态理解能力上取得重大突破,在学科推理(MMMU)、文档理解(ChartQA)、界面定位(ScreenSpot-v2)和视频理解(VideoMME)等关键指标上刷新行业纪录。创新性地引入"思考"与"非思考"模式切换功能,前者实现100%控制成

文章图片
#人工智能#AI
    共 18 条
  • 1
  • 2
  • 请选择