logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

GPT-4o 原生图像生成技术解析:从模型架构到吉卜力梦境的实现

最近不少 AI 爱好者、设计师、Vlogger 在社交平台晒出了 GPT-4o 生成的梦幻图像,尤其是**吉卜力风格的作品**——柔和光影、日系构图、治愈色彩、富有情感的角色表达,一下子击中了无数人的“童年回忆 +审美舒适区”。

文章图片
#人工智能
什么是强化学习中的奖励黑客?——从OpenAI前安全主管翁荔的深度分析看AI安全问题

在人工智能(AI)技术的迅猛发展中,强化学习(RL)作为一种关键技术,已经被广泛应用于许多领域,如机器人控制、自动驾驶、自然语言处理等。然而,随着AI系统变得越来越复杂,我们也面临着一系列新的挑战,其中之一便是“奖励黑客”问题(Reward Hacking)。这一问题不仅影响强化学习算法的性能和行为,也可能对现实世界中的AI应用产生深远的影响。近期,OpenAI的前安全主管翁荔(Lilian We

文章图片
#安全#人工智能#深度学习
CVPR讲座总结(一)-探索图像生成基础模型的最新进展

在CVPR24上由杨正远(Zhengyuan Yang)主持的教程中,我们深入探讨了图像生成基础模型的激动人心的世界。这些模型在过去的一年中取得了显著进步,展示了在质量、人类对齐和推理速度方面的重大改进。这篇博客文章提供了教程中讨论的关键点的综合总结,包括训练技术、评估方法以及大规模多模态模型(LMMs)与生成模型的集成。————————————————

文章图片
#人工智能#计算机视觉#pytorch
理解、检测与克服大语言模型的外在幻觉

大语言模型(LLMs)在自然语言处理领域展现了巨大的潜力,但同时也带来了“幻觉”问题。幻觉指的是模型生成不真实、虚构或不一致的内容。Lilian Weng,OpenAI安全系统团队负责人,最近在她的博客中详细梳理了在理解、检测和克服大语言模型幻觉方面的研究成果。本文将详细介绍这些研究成果,探讨幻觉的定义、类型、产生原因、检测方法及克服策略。

文章图片
#语言模型#人工智能#自然语言处理
AI技术颠覆游戏开发:谷歌DeepMind GameNGen实时生成《DOOM》探秘

近年来,生成式人工智能(AIGC)在图像和视频生成领域取得了巨大突破。然而,谁能想到,这项技术正逐渐渗透进游戏开发领域,且潜力巨大。2023年8月29日,谷歌DeepMind发布了名为《扩散模型是实时游戏引擎》(Diffusion Models Are Real-Time Game Engines)的论文,提出了全新的AI游戏生成引擎GameNGen。令人惊讶的是,GameNGen无需传统的游戏引

文章图片
#人工智能#机器学习
人工智能的未来:从知识廉价时代到AI主导国家模式

随着人工智能(AI)技术的飞速发展,知识的获取和使用正变得更加普及与廉价。这不仅引发了技术领域的深刻变革,也将对全球社会经济模式产生广泛影响。特别是在《时代》杂志对风险投资巨头维诺德·科斯拉(Vinod Khosla)的专访中,他就人工智能的未来提出了一些引人深思的观点,探讨了技术乐观主义、AI风险预防、工作消失和国家主导的AI模型等话题。这些见解不仅是对AI未来的预测,也为我们提供了一个清晰的思

文章图片
#人工智能#大数据
更好的数据才是一切:Datology 创始人 Ari Morcos 谈 Data Curation 的未来

在过去两年里,大模型几乎以光速发展:参数量从百亿级推到万亿级,算力投入也从几千万美金飙升到数十亿美金。然而,我们也能明显感觉到,近来新模型的能力提升正在趋缓。算力和参数的堆叠,边际效益不断递减。于是问题来了——**Scaling Laws 是否已经失效?我们真的撞上了“数据墙”吗?**DatologyAI 创始人 **Ari Morcos** 给出的答案是:**数据才是影响 AI 研究的最大变量,

文章图片
#人工智能#机器人
更好的数据才是一切:Datology 创始人 Ari Morcos 谈 Data Curation 的未来

在过去两年里,大模型几乎以光速发展:参数量从百亿级推到万亿级,算力投入也从几千万美金飙升到数十亿美金。然而,我们也能明显感觉到,近来新模型的能力提升正在趋缓。算力和参数的堆叠,边际效益不断递减。于是问题来了——**Scaling Laws 是否已经失效?我们真的撞上了“数据墙”吗?**DatologyAI 创始人 **Ari Morcos** 给出的答案是:**数据才是影响 AI 研究的最大变量,

文章图片
#人工智能#机器人
GPT-4o语音功能潜在风险分析与技术挑战

近年来,随着大语言模型(LLM)技术的飞速发展,人工智能的能力在语音处理领域也取得了显著进展。OpenAI推出的GPT系列模型正成为人工智能领域的标杆。然而,在最新的GPT-4o版本中,尽管语音功能具备广阔的应用前景,但也暴露出一系列潜在的安全隐患和技术问题,尤其是未经授权的语音生成、语音模仿和版权风险等。这些问题引起了业界的广泛关注,并对AI技术的应用带来了挑战。本文将围绕OpenAI发布的红队

文章图片
#深度学习#人工智能
为什么要放弃LangChain:从生产力工具到阻碍

在AI开发工具的生态系统里,LangChain一直是一个备受争议的产品。一些开发者欣赏其丰富的工具、组件和易于集成的特点,另一些开发者则认为其复杂的抽象和嵌套抽象反而成为了开发的障碍。本文将结合Fabian Both的实际经验,详细探讨为什么他的团队最终决定放弃LangChain,以及如何开发大模型应用。

文章图片
#人工智能#深度学习
    共 105 条
  • 1
  • 2
  • 3
  • 11
  • 请选择