logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

科研快报 |AI如何学会水墨丹青?这篇论文让 diffusion模型懂了“勾勒与晕染”

近期发表于《Pattern Recognition》(Q1/一区)的论文提出ChipDiff模型,专门解决中国水墨画风格迁移难题。该模型创新性地采用两阶段扩散机制:前期(t≥40)专注于结构保持,后期(t<40)注入水墨纹理细节。通过精心设计的损失函数组(包括VGG感知损失、HED边缘损失等)和专用TCWP数据集,模型成功模拟了"先勾勒后晕染"的传统技法。实验表明,Chi

文章图片
#人工智能
科研快报 |液态金属“造”眼睛!《Science Robotics》仿生视觉突破

《Science Robotics》最新研究提出了一种基于液态金属变形材料的仿生自适应瞳孔反射(APR)系统,为机器视觉提供创新解决方案。该系统模拟生物视觉闭环反馈机制,由半球形光突触阵列、液态金属逻辑模块和自适应瞳孔组成,能通过物理形变在0.5秒内调节进光量,显著提升强光环境下的图像识别精度至83.56%(传统方法仅68.38%)。该系统支持编程模拟多种动物瞳孔形态,在自动驾驶、仿生机器人等领域

文章图片
#人工智能#计算机视觉#图像处理 +2
与时俱进 |V2A技术(Video to Audio)

谷歌DeepMind推出的V2A技术通过AI分析视频内容生成同步音轨,实现了视觉到听觉的跨模态转换。该技术采用扩散模型和预训练映射网络,显著提升了音频生成质量和效率。主要应用于影视制作、内容修复、游戏开发等领域,能自动生成背景音乐、环境音效等。尽管面临视频质量依赖、唇形同步等挑战,但通过模型轻量化、精细控制等优化方向,V2A技术正推动AIGC在音视频融合领域的发展。

文章图片
#音视频#人工智能#AI
科研快报 |从特斯拉到科沃斯:具身智能让机器人成真!

摘要:《Nature Machine Intelligence》最新研究提出AI在机器人技术中的发展路线图,强调具身智能需结合物理先验与学习框架,分阶段解决感知协同、泛化能力等核心挑战。短期聚焦数据集构建与仿真训练,长期目标为终身学习与跨平台迁移。应用方面,人形机器人(如Optimus)、物流机器人(如Digit)和服务机器人快速商业化,但仍面临训练成本高、安全性等瓶颈。研究指出,实现可靠具身智能

文章图片
#机器人#人工智能#机器学习 +3
科研快报 |从特斯拉到科沃斯:具身智能让机器人成真!

摘要:《Nature Machine Intelligence》最新研究提出AI在机器人技术中的发展路线图,强调具身智能需结合物理先验与学习框架,分阶段解决感知协同、泛化能力等核心挑战。短期聚焦数据集构建与仿真训练,长期目标为终身学习与跨平台迁移。应用方面,人形机器人(如Optimus)、物流机器人(如Digit)和服务机器人快速商业化,但仍面临训练成本高、安全性等瓶颈。研究指出,实现可靠具身智能

文章图片
#机器人#人工智能#机器学习 +3
到底了