logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

突发!开源!首个金融领域推理大模型Fin-R1:仅7B参数,逼近DeepSeek满血版效果

当通用大模型陷入 “参数军备竞赛”,Fin-R1 的出现标志着 AI 发展进入 “精耕时代”。通过深度理解行业需求、构建专业化训练体系,小参数模型不仅能在垂直领域与巨无霸模型掰手腕,更打开了技术普惠的想象空间。这场由上海财大实验室发起的金融 AI 革命,正在悄然改写行业规则。

文章图片
#开源#金融#知识图谱 +3
4090单卡跑满血版DeepSeek-R1,清华团队开源项目再破大模型推理门槛

DeepSeek-R1火遍海内外,但推理服务器频频宕机,专享版按GPU小时计费的天价成本更让中小团队望而却步。而市面上所谓“本地部署”方案,多为参数量缩水90%的蒸馏版,背后原因是671B参数的MoE架构对显存要求极高——即便用8卡A100也难以负荷。因此,想在本地小规模硬件上跑真正的DeepSeek-R1,被认为基本不可能。但就在近期,清华大学KVCache.AI团队联合趋境科技发布的,推理生成

文章图片
#开源#算法#人工智能 +3
爆火 | API终将淘汰,MCP+Milvus+LLM才是Agent开发新范式

大模型很聪明,但又貌似什么问题都解决不了。这应该是不少用户使用大模型过程中都会面临的问题。比如,问deepseek,即将到来的清明节有什么习俗,AI可以引经据典的给出答案;但如果要它给出一份三天两晚的清明旅行规划,给出的答案,就好像总是差点意思。原因很简单,在做旅行规划的时候,大模型缺乏必要的天气、机票、铁路、导航、酒店等必要数据与工具的接入。就像一个顶级聪明的大脑,但没有配备外部的“数据”输入,

文章图片
#milvus#网络#服务器 +3
数据分析师没项目经验就完蛋,这8个项目资源拿走不谢

如何了解数据分析师的技能需求要了解一个岗位的技能需求,有一个简单的办法,那就是去看招聘网站。如果你的学习目标是求职,那就去看求职网站上相关岗位的需求。这是最直接的。也是以终为始的方法。在看的时候要注意几点:1.多看:不同公司的招聘需求写的良莠不齐,光看几家的招聘需求可能不能得到核心的需求,甚至误导你。看个几十上百家有代表性的公司的招聘需求。正所谓熟读唐诗三百首,不会吟诗也会吟也会吟。2.大胆:招聘

文章图片
#python
DeepMind最新:发布说话者-推理者架构实现Agents快慢思考 | 融合系统1+系统2

Talker-Reasoner架构由两个核心组件组成:1. Talker(说话者):对应人类的系统1,负责快速、直觉性的对话交互。2. Reasoner(推理者):对应人类的系统2,负责复杂推理、规划和信念形成。这两个组件通过共享内存进行交互,实现了快速响应与深度思考的有机结合。研究者清晰地用一张图说明了用户、世界、Talker Agent和Reasoner Agent之间的交互关系。以下是图片的

文章图片
#架构#语言模型#人工智能 +1
LlamaIndex团队技术报告:“RAG的尽头是Agent”

LlamaIndex团队2024年Talk:报告人:Jerry Liu, LlamaIndex co-founder/CEO,报告主题:“”,主题原文:“Beyond RAG: Building Advanced Context-Augmented LLM Applications”。看完报告,一个通俗点的理解是“”,概要内容如下:RAG的局限性:RAG最初是为简单问题和小型文档集设计的,它通常包

文章图片
#人工智能#语言模型#自然语言处理 +1
AI智能体下一步,模拟人机交互,所有人的工作流将被改变

不过一个比较常见的观点是,AI智能体是一个更加先进的AI工具,它能够感知周围环境,模拟人类思考与工作,可以独立做出决策,执行步骤繁多且复杂的特定任务。而且能够从反馈中进行学习,同时还可以和其他的软件或者是AI工具进行连接和交互。就像是职场工作当中,

文章图片
#人工智能#人机交互#transformer +2
智能体最新进展

矢量数据是地理信息科学(GIS)中的两种核心数据结构之一,对于准确存储和表示地理空间信息至关重要。Shapefile是最广泛使用的矢量数据格式,已成为所有主要地理信息系统支持的行业标准。然而,处理这些数据通常需要专业的GIS知识和技能,这为其他领域的研究人员设置了障碍,并阻碍了空间数据分析中的跨学科研究。此外,尽管大型语言模型(LLMs)在自然语言处理和任务自动化方面取得了显著进展,但在处理GIS

文章图片
#知识图谱#人工智能#机器人 +1
LangGraph发表标准化LLM Agent互操作协议

随着大型语言模型(LLM)Agent 的应用日益广泛,这些 Agent 能够执行复杂的任务,如自然语言处理、信息检索和自动化决策。随着技术的发展,出现了多种构建和部署这些 Agent 的方法和框架,例如 LangGraph、AutoGen、OpenAI 的 Assistant API、CrewAI 和 LlamaIndex 等。这些框架和方法各有优势,但也带来了一个挑战:如何实现不同 Agent

文章图片
#知识图谱#人工智能#数据库 +2
Agent 大模型与应用场景之间的桥梁

你不明白的大模型Agent代理,为什么会是这样的?Agent——俗称智能体,是基于大模型开发的一个具有自主规划和逻辑推理能力的智能代理。说到Agent,可能很多人看的都是网上的一些概念和理论,事实上对Agent并没有一个直观的理解,那么到底什么是Agent呢?它和大模型以及各种应用之间有什么关系?Agent与大模型和应用的关系在之前的文章中曾经提到过,如果把大模型技术与人做对比,那么大模型就是人的

文章图片
#语言模型#目标检测#目标跟踪 +1
    共 158 条
  • 1
  • 2
  • 3
  • 16
  • 请选择