logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

o1圈的新王!阿里QwQ-32B开源

11月28日,阿里通义千问正式推出了QwQ-32B-Preview[1]实验性研究模型。该模型展现出卓越的AI推理能力,尤其在数学和编程领域的复杂问题解决上表现突出,是少数能与OpenAI的o1匹敌的模型之一。数据来源于官方QwQ-32B-Preview的具体表现:在AIME、MATH等基准测试中,其表现优异,如在MATH-500基准测试中成绩为90.6%还具备优秀的编码能力,在LiveCodeB

文章图片
#android#人工智能#AIGC +1
Cursor+MCP实现用嘴操纵数据库,太丝滑了!

通过 MCP,我让 Cursor 直接操作起了我本地的数据库。无论是数据查询,还是数据的增删改,他都无所不能。。说实话,像 DeepSeek 啊、豆包啊或者 claude 之类的大模型再牛逼,当你问他,我本地数据库里面有多少条数据,他就会显得有些爱莫能助。因为他的训练集不可能会包含你的隐私数据。这也导致了大模型在个人或企业隐私数据的瓶颈。以前,很多人直接搞个本地的大模型,然后将隐私数据投喂给大模型

文章图片
#数据库#人工智能#金融 +2
最强总结!如何从头构建一个机器学习模型

数据科学是一个多学科领域,涉及从数据中提取见解和知识。为了系统地处理数据科学项目,专业人员遵循称为数据科学生命周期的结构化流程。此生命周期包含各个阶段,每个阶段都有特定的任务和目标,以确保有效地开发和部署数据驱动的解决方案。1.问题定义数据科学生命周期的第一阶段是定义问题。这涉及了解业务背景、确定要解决的问题以及设定明确的目标。示例:客户流失预测目标:预测哪些客户可能会取消订阅。业务背景:一家电信

文章图片
#机器学习#人工智能#算法 +3
清华NLP开源RAG开箱即用框架,自动适配知识库无需纠结模型选型

通常需要兼顾测试制定、检索调优、模型调优等关键环节,繁琐的工作流程往往让人无从下手。,该框架革新了传统RAG系统的开发与配置方式,极大降低了学习成本和开发周期。UltraRAG 不仅具备满足专业用户需求的“单反相机”级精细化配置能力,同时也提供类似“卡片机”的一键式便捷操作,。更重要的是,相比复杂配置的Llamaindex等传统RAG框架,,有效避免在“模型选型”的反复纠结。同时,其又能为科研需求

文章图片
#自然语言处理#人工智能#架构 +3
《大模型面试宝典》(2024版) 正式发布!

2022 年11月底,OpenAI 正式推出 ChatGPT ,不到两个月的时间,月活用户就突破1亿,成为史上增长最快的消费者应用。目前国内已发布的大模型超过200个,大模型的出现彻底改变了我们的生活和学习方式。现在只要你想从事 AI 相关的岗位,无论是计算机视觉(CV)、自然语言处理(NLP)、搜广推、风控等,。节前,我们星球群组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、最近参加

文章图片
#面试#职场和发展#人工智能 +1
清华团队构建大型社会模拟器AgentSociety,推动智能社会治理与研究范式变革

凡我无法创造的,我就无法真正理解。” – 费曼智能时代呼啸而来,正深刻改变着人们生产、生活和学习的方式。过去几十年里,社会科学家和相关领域的研究者,一直**致力于通过实证数据与模型揭示人类行为和智能社会运行的基本规律,试图找出隐藏在各种社会现象和治理痛点背后的因果机制,从而回答 “是什么?为什么?如何治” 等一系列问题。

文章图片
#人工智能#政务#搜索引擎 +2
TPAMI 2025 | 先解耦再组合:学习不变解耦特征用于组合零样本学习

组合零样本学习(Compositional Zero-Shot Learning, CZSL)旨在通过从训练集中已见过的属性-对象组合中学习知识,来识别新的组合。以往的研究主要将图像及其对应的组合投影到一个共同的嵌入空间中,通过计算它们的兼容性得分来进行识别。然而,由于属性和对象共享上述学习到的视觉表示,导致模型容易利用虚假的相关性,并对已见过的组合产生偏差。相反,作者将CZSL重新考虑为一个分布

文章图片
#学习#深度学习#人工智能 +2
DeepSeek-R1模型架构解读

本文深入探讨了 DeepSeek-R1 模型的架构。让我们追溯DeepSeek-R1模型从输入到输出的全过程,找出架构中的新进展和关键部分。DeepSeek-R1模型主要基于 DeepSeek-V3-Base 模型架构。本文旨在介绍其设计的所有核心方面。DeepSeek-R1 从其基础模型 DeepSeek-V3-Base继承了 128K的上下文长度。最初,DeepSeek-V3 采用 4K 上下

文章图片
#架构#人工智能#机器学习 +2
使用Langchain构建简单的数据库Agent

这篇文章我们介绍一个使用LangChain实现SQLagent的方法,LangChain直接内置了自己的SQLagent实现-—SQLDatabaseChain。这个方法使用 SQL Alchemy 与数据库交互。感兴趣的可以考虑一下这两个方案是否可以融合,这样保证SQL的准确性从而提升最终结果的准确率。下面将介绍今天主要内容的实现步骤:实现步骤首先,我们得有一个数据库。这里我们用的是ClickH

文章图片
#数据库#oracle#人工智能 +2
KG4Diagnosis - 知识图谱增强的多智能体大模型在医学诊断中的应用

这篇论文提出了KG4Diagnosis,一个结合了大型语言模型(LLMs)和知识图谱增强的分层多智能体框架,用于医疗诊断。KG4Diagnosis 是一个创新的分层多智能体大型语言模型(LLM)框架,采用自动化知识图谱构建技术进行医学诊断,结合语义实体提取、决策关系重构和人工引导推理,以提高准确性并应对 LLM 的幻觉挑战。将大型语言模型(LLMs)整合到医疗保健诊断中需要系统框架,这些框架能够处

文章图片
#知识图谱#人工智能#neo4j +3
    共 166 条
  • 1
  • 2
  • 3
  • 17
  • 请选择