logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Dexmal 原力灵机开源 Dexbotic:具身智能的“Transformers“库来了

现在 AI 能写代码、能画画,但你有没有想过,让 AI 去拧个瓶盖,为什么就这么难?因为拧瓶盖这件事,需要三个能力同时在线:眼睛-视觉(ision): 它得先看懂——哪个是瓶子?哪里是盖子?盖子纹理是什么样?大脑-语言(anguage):它得理解人类的指令——“拧开瓶盖”是什么意思?是顺时针还是逆时针?用多大力?身体-动作(ction):它得精确地执行——手指要以多大角度抓住瓶盖?施加多大扭矩?这

#人工智能#大数据
解决多模态大模型幻觉问题的秘密武器:“啄木鸟”免重训方法!哪里出问题啄哪里!

最近多模态大模型的研究取得了巨大的进展。然而,这些模型在生成时存在着文本与图像不一致的问题,这个问题就是一直困扰研究者们的“幻觉难题”。▲给定一幅图像,MLLM会输出的回应,包括了物体层面和属性层面的幻觉。为了缓解这个问题,中科大开发了一种名为Woodpecker(啄木鸟)的新方法。这个方法可以从生成的文本中挑选出幻觉并进行纠正。具体来说,直接从模型给出的错误文本下手,“倒推”出可能出现“幻觉”之

文章图片
#人工智能
微软发布「升级版」多模态大模型 Kosmos-2!新增局部理解能力,解锁实体级交互

无疑,将自然语言真正的链接到视觉世界是实现智能的关键一步,而 KOSMOS-2 则有力的推进了视觉与语言更深层次的联系,实现了对象级感知图像区域的新能力,并且具有不俗的语言理解与图像识别的能力。当具身的 AI 真正进入现实世界,Grounding Capability 将是一个真正的基础能力,KOSMOS-2 的出现一定可以让一窥具身 AI 的真正曙光!

文章图片
#人工智能
冲出“包围圈”,阶跃星辰登顶国内多模态理解大模型榜首

今年 3 月份,阶跃星辰正式亮相时就一口气发布了三款大模型产品:综合性能超过 GPT-3.5 的千亿参数大模型 Step-1,千亿参数的多模态模型 Step-1V 和国内首款万亿参数模型语言大模型 Step-2 的预览版。除了自研应用,阶跃的 Step 系列模型正在获得越来越多开发者的选用,网红 AI 应用胃之书、国内首款 C 端 AI 电商应用物圆、AI 科研大模型专业社区 ReadPaper、

文章图片
#人工智能
南洋理工发布多模态金融交易Agent,平均利润提高36%!

FinAgent作为一个金融交易代理,其创新之处在于其多模态、工具增强和泛化的特性。FinAgent通过其市场情报模块、反思模块和决策制定模块,能够处理多种类型的数据,并从中提取关键见解以指导交易决策。其在金融交易任务中的表现优于多个先进的基准模型,特别是在盈利能力方面取得了显著的提升。FinAgent的案例分析展示了其在复杂市场环境中进行决策的能力,以及其在风险管理和财务灵活性方面的战略远见。未

文章图片
#人工智能
史上最大多模态图文数据集发布!

文 | 付瑶编 | 小轶最近多模态研究圈中出现了一个扬言 “史上最大规模”的多模态图文数据集:LAION-400。该数据集在今年8月完全公开,共计公开了 4亿图文对,可以依据不同的用途提供...

#机器学习#人工智能#深度学习 +2
免费不限次!智谱清影一上线就被玩疯了,国产AI视频生成卷起来了

而后,智谱在CogView的基础上延伸,于2022年提出并开源了在业界颇具影响力的文生视频模型CogVideo,这项工作被Meta提出的 Make-A-Video、Google的 Phenaki 和 MAGVIT、微软的女娲 DragNUWA、英伟达的 Video LDMs 等视频生成模型所引用。而CogVideoX,则是在CogVideo的基础上做了进一步系统性的优化,不仅生成效果更好,而且推理

文章图片
#人工智能
小时级的长视频生成!浙江大学发布MovieDreamer,AI电影时代到来了?

还记得前段时间刷屏朋友圈的Sora吗?它将生成视频的时长从几秒惊人地延长到前所未有的整整一分钟,惊艳了AI视频圈,不少人预言AI生成长达数小时的电影也指日可待。这不,浙江大学带着MovieDreamer走来了,再次刷新了视频生成的极限,将时长推向了小时级。MovieDreamer不仅可以塑造鲜活生动的角色,编织出连贯流畅的故事线,在画面上精雕细琢,每一帧的细节更是拉满。先来欣赏一下MovieDre

文章图片
#音视频#人工智能
英伟达盯上了华为!特供版AI芯片价格首次曝光!起售价11万元低于华为

H20是高缓存、高带宽,但算力性能差,大约是华为昇腾910算力的一半,但缓存与带宽比910B高,其中带宽是华为昇腾 910B 的两倍,也即H20在互连速度方面更有优势,互连速度决定了芯片之间数据传输的速度。经销商销售的H20服务器预配置8颗 AI 芯片,售价 140 万元。,中国电信在 10 月份采购了价值约 3.9 亿美元的由华为芯片驱动的AI服务器,而中国联通在2022年也花费了至少2000万

#人工智能
花15分钟搭一套国产AI系统,把Clawdbot巨额token成本干到0

这意味着所有支持 OpenAI API 的工具——Clawdbot、LangChain、LlamaIndex、各种 IDE 插件,改一行地址就能接入,不需要改代码逻辑,不需要换 SDK。华为昇腾全系列、摩尔线程、沐曦、昆仑芯,主流国产芯片全部原生适配,不是那种"理论支持、实际自己折腾"的适配,是真的插上卡就能认、拉下模型就能跑。如果你也踩过国产卡的坑,或者受够了昂贵的 API 账单,2 月 2 日

#人工智能#python
    共 641 条
  • 1
  • 2
  • 3
  • 65
  • 请选择