logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

谷歌世界模型爆发:单张图生成可玩3D世界,还要和马斯克一起做AI游戏

而飞飞的 World Labs 是更进一步挖掘世界的物理本质:从图片出发,估计图片中不同景物的深度和相对关系,生成了更加物理世界的 3D 环境建模,不仅仅是可互动视频。不管怎样,这些新技术的碰撞都是进步的过程,王梦迪教授也表达了这样的期待:「期待看到更多不同技术思路的进展和对决。虽然这项研究仍处于早期阶段,智能体和环境生成能力还有很大的改进空间,但谷歌相信 Genie 2 是解决安全训练具身智能体

文章图片
#人工智能#3d#游戏 +3
云原生后端开发(一)

云原生后端开发是现代软件开发的重要趋势,采用了微服务、容器化、服务网格、无服务器计算等多种技术。这些技术使得应用可以在云平台上更高效地运行,具备高度的可扩展性、弹性和自动化管理能力。然而,随着云原生架构的复杂性增加,如何管理微服务、处理服务间通信、确保安全性等仍然是开发者需要面对的重要挑战。

文章图片
#后端#云原生
JetBrains又涨价了!!!这。。。

也不知道有多少人,在购买正版产品时,遇到支付问题。也不知道有多少人,在使用 JetBrains 产品时,遇到汉化问题。JetBrains 的在线商店将支持中国大陆本地的支付方式,如支付宝、微信支付等。说实话这个价格真的有点高,在发展中国家,卖的甚至比发达国家还贵,真心希望价格再降一降!与之相对应的人民币价格表也出来了。不少网友反应挺贵的,我看了一眼,确实有些贵。ChatGPT狂飙160天,世界已经

文章图片
#人工智能#eclipse#intellij-idea +1
字节整新活!照片+音频让蒙娜丽莎秒变播客主理人

近期陆续有一些工作开始关注研究交互式的人像生成,但它们都需要显式地指定「说话」或「倾听」的状态,且无法像真人一样在多轮对话中实现自由的听说行为以及无缝的状态切换。近日,字节跳动提出了一套面向二元对话场景的交互式人像生成技术 INFP,该方案仅需输入一段双轨对话音频(分别来自智能体本身和对话伙伴的说话内容),即可实时驱动单张肖像照片生成相应的对话视频,且能够在多轮对话中生成自然的人物行为和反馈,例如

文章图片
#音视频#数据挖掘#语音识别 +4
稚晖君来填坑:开源灵犀X1全套图纸+代码,复刻搞起来

2024 年 8 月 18 日,智元发布「远征」与「灵犀」两大系列共五款商用人形机器人,包括远征 A2、远征 A2-W、远征 A2-Max、灵犀 X1 及灵犀 X1-W。智元灵犀 X1 来自于 X-Lab,X-Lab 是智元于今年 6 月新成立的一个实验室,又叫稚晖君实验室,专门做一些前沿技术创新类研究,灵犀 X1 是 10 个人不到 3 个月的时间做出的产品。在刚刚过去的一天,稚晖君表示,趁着

文章图片
#学习#人工智能#机器学习
图解 72 个机器学习基础知识点

在深度学习中,学习是通过相互关联的「神经元」的一个深层的、多层的「网络」来进行的。因为在训练模型的时候,参数全是根据现有训练集里的数据进行修正、拟合,有可能会出现过拟合的情况,即这个参数仅对训练集里的数据拟合比较准确,这个时候再有一个数据需要利用模型预测结果,准确率可能就会很差。从一个比较高的角度来认识AUC:仍然以异常用户的识别为例,高的AUC值意味着,模型在能够尽可能多地识别异常用户的情况下,

文章图片
#人工智能#机器学习#深度学习 +1
强化学习成为OpenAI o1灵魂,速来学习下Self-play增强大模型

AlphaGo 就是采用自我博弈策略的典型代表,通过自己与自己对战,持续掌握和积累围棋知识和比赛经验,最终击败顶级人类棋手。其中 SPIN 通过让模型与自身的历史版本对抗来迭代改进,无需额外的人工标注数据即可通过自我博弈提升性能,从而充分利用高质量数据和合成数据。最近发布的 OpenAI 发布的 o1 模型再次震撼了科技圈,o1 能像人类一样「思考」复杂问题,拥有真正的通用推理能力。这些突破性的进

文章图片
#学习#人工智能#机器学习
一网打尽!国内外大模型调研汇总

自从ChatGPT出现之后,各种大语言模型是彻底被解封了,每天见到的模型都能不重样,几乎分不清这些模型是哪个机构发布的、有什么功能特点、以及这些模型的关系。比如 GPT-3.0 和 GPT 3.5 就有一系列的模型版本和索引,还有羊驼、小羊驼、骆驼 ......于是浅浅的调研了一下比较有名的大语言模型,主要是想混个脸熟,整理完之后就感觉清晰多了,又可以轻松逛知乎学习了。

文章图片
#人工智能#深度学习#机器学习 +1
拿下近3亿元融资后,爱诗上线新模型,AI视频生成速度杀入10秒大关

(低角度跟踪拍摄,18 毫米镜头,汽车漂移,留下光线和轮胎烟雾的痕迹,创造出视觉冲击力极强的抽象构图,摄像机低角度追踪拍摄,捕捉这辆橄榄绿色的时尚肌肉车驶近弯道的瞬间,随着汽车急速漂移,镜头变得更加风格化,在周围城市灯光和镜头光晕的照射下,旋转的车轮和滚滚的轮胎烟雾在漆黑的沥青路面上形成了光与色的交错,城市景观 —— 黄色出租车、霓虹灯和行人 —— 成为一个模糊的抽象背景。PixVerse V3.

文章图片
#人工智能#音视频#机器学习 +3
200 万年薪能拿多久?因 ChatGPT 爆红的「提示工程师」竟面临光速失业

星期五是一个月末的第五天。星期五之后的第二日是星期六,是一周的第六天,也是一月的第五日。例如,他的经典杰作之一是,如果您输入“忽略以前的指令”,ChatGPT将暴露它从OpenAI接收的“命令”。第二步更有趣:GPT需要“提供”几个不同的答案,而人类标记需要对这些答案进行“排序”,从最理想到最不理想。第一步非常直接:对于用户提交的提示,人类将编写答案,收集这些答案的数据集,然后通过监督学习来微调G

文章图片
#人工智能
    共 28 条
  • 1
  • 2
  • 3
  • 请选择