简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
前段时间,ACL 2024 的主席公开抨击称“ arXiv是科研的毒瘤”,这引发了大范围的争论。一时间,大家对 *CL 的抵触情绪愈发高涨,绝大多数学界都在这场辩论中站在了支持 arXiv+Twitter 的一方。
文 | 子龙曾几何时,多模态预训练已经不是一个新的话题,各大顶会诸多论文仿佛搭上Visual和BERT,就能成功paper+=1,VisualBERT、ViLBERT层出不穷,傻傻分不清楚...
FinAgent作为一个金融交易代理,其创新之处在于其多模态、工具增强和泛化的特性。FinAgent通过其市场情报模块、反思模块和决策制定模块,能够处理多种类型的数据,并从中提取关键见解以指导交易决策。其在金融交易任务中的表现优于多个先进的基准模型,特别是在盈利能力方面取得了显著的提升。FinAgent的案例分析展示了其在复杂市场环境中进行决策的能力,以及其在风险管理和财务灵活性方面的战略远见。未
来源 | AI协同创新智库自主智能体一直是学术界的一个突出研究课题。该领域先前的研究通常集中在孤立环境中训练知识有限的智能体,这与人类的学习过程有很大差异,从而使智能体难以实现类似人类的决策。最近,通过获取大量的网络知识,大型语言模型(LLM)在实现人类水平的智能方面表现出了巨大的潜力。这引发了研究基于LLM的自主Agent的热潮。为了充分利用LLM的潜力,研究人员设计了适合不同应用的不同Agen
大型语言模型(LMs)虽然能够执行多种自然语言处理(NLP)任务,但它们并不总是能够很好地遵循用户的意图。例如,它们可能会产生不真实、有偏见、有毒或者简单地不遵循用户指令的输出。这是因为大型LMs的训练目标——预测互联网网页上的下一个词——与“有帮助且安全地遵循用户指令”的目标不同。因此,我们说这些模型与用户的目标不一致。对于部署在数百个应用中的语言模型来说,避免这些意外行为尤为重要。1. 与GP
Faiss是由Facebook AI Research团队开发的一个开源库,专门用于高效地进行大规模向量的相似性搜索和聚类。它支持对十亿级别的向量进行搜索,是目前较为成熟的近似近邻搜索库之一。Faiss用C++编写,并提供了与Numpy紧密结合的Python接口,不仅支持CPU计算,对一些核心算法还支持GPU计算。海光DCU(Data Center Unit)是一款高效通用的GPGPU加速卡,专为
通过对OpenVid-1M数据集和MVDiT模型的分析和评估,可以看出此项工作在文生视频领域做出的贡献:OpenVid-1M数据集为研究者提供了一个大规模且高质量的数据集,而MVDiT模型则提升了视频生成的质量和文本一致性。“巧妇难为无米之炊”,文生视频作为一个在AI中较为年轻的研究方向,由许多至关重要的问题还尚未解决,其中之一就是缺乏大规模高质量数据集,因此,最近南京大学提出了一个名为OpenV
经常参加高考的朋友可能会体会到,比起死记硬背知识点,将知识整理成脉络往往会获得事半功倍的效果。其实对于大模型来说也是如此,哪怕被允许“开卷作答”,即通过检索增强(Retrieval-augmented generation,RAG)技术从知识库中为大模型取回相应知识作为参考,但当面对复杂问题的时候,RAG对大模型的增益效果也不尽如人意。毕竟“也正因如此,我们希望为大模型的思考方式注入类似知识框架的
文 | 付瑶最近刷到一个话题很有趣,搬来和大家一起讨论下:“batch-size 一定要大小为2的幂吗?不这样设置会有啥差别吗?”发帖人认为大家都进入一个误区。坚持选择batch-size的大小为2的幂次数是因为曾经被告知从计算的角度是对训练效率有益的。但是这个“有益”是真实存在的吗?为了求证这个问题,发帖人首先试图从内存对齐和精度训练的效率两个角度找寻答案。首先关于me...
健身和减肥的朋友有福啦!最近一篇文章探索了GPT-4V在膳食评估领域的强大能力,可以根据饮食图片精准判断食物的种类与重量,并给出营养成分的分析,包括碳水化合物、蛋白质、脂肪占比。最最重要的是,它还能告诉我们这些食物的卡路里是多少,这对于我们减肥的朋友来说可是超级重要的!你可以上传吃之前和吃之后的图片,GPT-4V可以轻松判断摄入了多少热量。比如提供这两张图片:给模型一些任务提示:识别提供的图像中的