logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

字节整新活!照片+音频让蒙娜丽莎秒变播客主理人

近期陆续有一些工作开始关注研究交互式的人像生成,但它们都需要显式地指定「说话」或「倾听」的状态,且无法像真人一样在多轮对话中实现自由的听说行为以及无缝的状态切换。近日,字节跳动提出了一套面向二元对话场景的交互式人像生成技术 INFP,该方案仅需输入一段双轨对话音频(分别来自智能体本身和对话伙伴的说话内容),即可实时驱动单张肖像照片生成相应的对话视频,且能够在多轮对话中生成自然的人物行为和反馈,例如

文章图片
#音视频#数据挖掘#语音识别 +4
稚晖君来填坑:开源灵犀X1全套图纸+代码,复刻搞起来

2024 年 8 月 18 日,智元发布「远征」与「灵犀」两大系列共五款商用人形机器人,包括远征 A2、远征 A2-W、远征 A2-Max、灵犀 X1 及灵犀 X1-W。智元灵犀 X1 来自于 X-Lab,X-Lab 是智元于今年 6 月新成立的一个实验室,又叫稚晖君实验室,专门做一些前沿技术创新类研究,灵犀 X1 是 10 个人不到 3 个月的时间做出的产品。在刚刚过去的一天,稚晖君表示,趁着

文章图片
#学习#人工智能#机器学习
图解 72 个机器学习基础知识点

在深度学习中,学习是通过相互关联的「神经元」的一个深层的、多层的「网络」来进行的。因为在训练模型的时候,参数全是根据现有训练集里的数据进行修正、拟合,有可能会出现过拟合的情况,即这个参数仅对训练集里的数据拟合比较准确,这个时候再有一个数据需要利用模型预测结果,准确率可能就会很差。从一个比较高的角度来认识AUC:仍然以异常用户的识别为例,高的AUC值意味着,模型在能够尽可能多地识别异常用户的情况下,

文章图片
#人工智能#机器学习#深度学习 +1
强化学习成为OpenAI o1灵魂,速来学习下Self-play增强大模型

AlphaGo 就是采用自我博弈策略的典型代表,通过自己与自己对战,持续掌握和积累围棋知识和比赛经验,最终击败顶级人类棋手。其中 SPIN 通过让模型与自身的历史版本对抗来迭代改进,无需额外的人工标注数据即可通过自我博弈提升性能,从而充分利用高质量数据和合成数据。最近发布的 OpenAI 发布的 o1 模型再次震撼了科技圈,o1 能像人类一样「思考」复杂问题,拥有真正的通用推理能力。这些突破性的进

文章图片
#学习#人工智能#机器学习
一网打尽!国内外大模型调研汇总

自从ChatGPT出现之后,各种大语言模型是彻底被解封了,每天见到的模型都能不重样,几乎分不清这些模型是哪个机构发布的、有什么功能特点、以及这些模型的关系。比如 GPT-3.0 和 GPT 3.5 就有一系列的模型版本和索引,还有羊驼、小羊驼、骆驼 ......于是浅浅的调研了一下比较有名的大语言模型,主要是想混个脸熟,整理完之后就感觉清晰多了,又可以轻松逛知乎学习了。

文章图片
#人工智能#深度学习#机器学习 +1
拿下近3亿元融资后,爱诗上线新模型,AI视频生成速度杀入10秒大关

(低角度跟踪拍摄,18 毫米镜头,汽车漂移,留下光线和轮胎烟雾的痕迹,创造出视觉冲击力极强的抽象构图,摄像机低角度追踪拍摄,捕捉这辆橄榄绿色的时尚肌肉车驶近弯道的瞬间,随着汽车急速漂移,镜头变得更加风格化,在周围城市灯光和镜头光晕的照射下,旋转的车轮和滚滚的轮胎烟雾在漆黑的沥青路面上形成了光与色的交错,城市景观 —— 黄色出租车、霓虹灯和行人 —— 成为一个模糊的抽象背景。PixVerse V3.

文章图片
#人工智能#音视频#机器学习 +3
200 万年薪能拿多久?因 ChatGPT 爆红的「提示工程师」竟面临光速失业

星期五是一个月末的第五天。星期五之后的第二日是星期六,是一周的第六天,也是一月的第五日。例如,他的经典杰作之一是,如果您输入“忽略以前的指令”,ChatGPT将暴露它从OpenAI接收的“命令”。第二步更有趣:GPT需要“提供”几个不同的答案,而人类标记需要对这些答案进行“排序”,从最理想到最不理想。第一步非常直接:对于用户提交的提示,人类将编写答案,收集这些答案的数据集,然后通过监督学习来微调G

文章图片
#人工智能
GitHub 又一可视化低代码神器,诞生了!速度!手慢无!

自从ILLA产品发布以来,新版本的迭代速度已经保持了两周,许多优秀的开发人员开始成为ILLA的贡献者。尽管在低代码赛道有很多竞争对手,但ILLA的产品在视觉设计方面获得了一致好评。相信随着ILLA产品功能的逐步完善,可以为开发者创造更多的便利和价值。

文章图片
#低代码#github
英伟达市值一周蒸发4060亿美元,AI时代「卖铲人」怎么就不香了?

对于这家价值 2.5 万亿美元的巨头来说,这些跌幅也向投资者展示了一个更为紧迫的问题:它的波动性现在远远超过了谷歌、苹果、微软、Meta 等美股六巨头,甚至让上蹿下跳的比特币,都显得平静了许多。英伟达上周的「成绩单」,证实了市场的乐观预期。多年来,英伟达在 GPU 和 CUDA 上的投入让它构建了一个难以撼动的生态系统,宛如一道深不可测的护城河,竞争对手想追赶几乎是不可能的事。大约是微软公司的四倍

文章图片
#人工智能#机器学习#神经网络
云原生后端开发(一)

云原生后端开发是现代软件开发的重要趋势,采用了微服务、容器化、服务网格、无服务器计算等多种技术。这些技术使得应用可以在云平台上更高效地运行,具备高度的可扩展性、弹性和自动化管理能力。然而,随着云原生架构的复杂性增加,如何管理微服务、处理服务间通信、确保安全性等仍然是开发者需要面对的重要挑战。

文章图片
#后端#云原生
    共 31 条
  • 1
  • 2
  • 3
  • 4
  • 请选择