logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型论文 | Theory of Agent:构造知行合一的智能体

Agent 为何需要「认知哲学」?当前AI(如ChatGPT)已能自主规划旅行、科研协作,但论文:Toward a Theory of Agents as Tool-Use Decision-Makers链接:https://arxiv.org/pdf/2506.00886!就像人类需要理解「我知道什么/该怎么做」,AI也需要明确的认知框架。“真正的自主性要求Agent扎根于认知框架——。打破「想

文章图片
#人工智能
如何构建企业级LLM应用?基于大模型的RAG应用开发与优化

随着ChatGPT的兴起,大语言模型再次走进人们的视野,其在NLP领域表现出的语言识别、理解以及推理能力令人惊叹。越来越多的行业开始探索大语言模型的应用,比如政务、医疗、交通、导购等行业。通义系列、GPT系列、LLama系列等模型,在语言交互场景下表现十分抢眼。以Gemini为代表这类大模型甚至发展出了视觉和听觉,朝着智能体的方向演化。他们在多个指标上展现的能力甚至已经超过了人类。为了解决纯参数化

文章图片
#自然语言处理#RAG
LIMO颠覆认知:无需10万级数据,数学推理竟可用极少样本激发!

在人工智能领域,数学推理一直被认为是最难掌握的能力之一。传统观点认为,要让大模型学会复杂推理,必须使用数十万甚至上百万的训练样本,否则只能停留在“记忆”而非“推理”层面。然而,LIMO 研究团队发现,这一观点可能并不正确。他们的实验表明,仅用 817 条精心挑选的样本,就能让大模型在数学推理任务上达到前所未有的高性能,甚至超越使用 100 倍数据训练的模型。

文章图片
#语言模型#人工智能
【码农福音】人大团队开源FlashRAG:RAG界的Hugging Face,零门槛玩转大模型增强检索!一行命令启动UI,小白也能秒变RAG大神!

FlashRAG的出现,让我想起2016年的TensorFlow——它没有发明CNN,却让百万开发者轻松玩转深度学习。如今,RAG正从“技术演示”走向真实生产力工具客服机器人不再瞎编退货政策医生助手能精准引用最新指南研究生写论文时,文献综述自动生成+溯源可查但技术终归是工具,关键在“谁来用,怎么用”。🪞 留给你一个思考:当RAG能完美回答“《民法典》第584条与2023年司法解释的冲突如何适用?

文章图片
#开源#ui#人工智能 +4
震惊!2025年AI编程助手已能写代码,程序员们慌了吗?盘点豆包、通义千问、WPS AI谁是开发者的最佳拍档!

当清晨的第一缕光透过窗帘,一位懂你日程、知你冷暖的“AI伙伴”也开始了一天的工作。一杯咖啡氤氲的香气里,行程梳理妥当,甚至晨会的简短发言提纲也已拟好;通勤路上,昨晚未看完的项目文档转化为语音播报,自动标注出关键数据;在工位前,面对庞杂的数据报表,秒级生成可视化图表;下午和客户见面前,输入核心思路,它快速生成PPT初稿,还匹配符合品牌调性的排版与配图;回家途中,语音告知晚餐需求,它会推送适配食材库存

文章图片
#人工智能#react.js#架构
【AI程序员必看】2025年12月全球AI大模型热度榜TOP20!从DeepSeek到豆包,技术趋势全解析,yyds!

AIGCRank发布2025年12月《AI产品热度榜单》和《AI大模型热度榜单》,基于全球应用市场、社交媒体、搜索引擎指数等综合评估。产品榜单涵盖豆包手机助手、钉钉AgentOS等20款热门AI应用;大模型榜单包括DeepSeek V3.2、GPT-5.2、豆包Seed 1.8等20个前沿大模型。榜单通过常态化监测体系,捕捉AI领域最新动态,为开发者提供市场参考与技术风向。

文章图片
#人工智能#java#开发语言 +1
【开发者必看】API调用哪家强?ChatGPT、豆包、DeepSeek收费深度扒皮,附超实用省钱攻略!

最近,AI圈有个热门话题:"ChatGPT、豆包、DeepSeek,谁的收费更香?"这不是技术讨论,而是一场"钱包保卫战"。随着AI大模型进入商业化阶段,各家厂商的定价策略差异巨大:

#人工智能#前端#算法 +2
一文彻底搞懂深度学习:正则化(Regularization)、归一化(Normalization)

你是否也有这样的困扰?“我的模型在训练集上100分,测试集上却只有60分?”“我的神经网络训练了500轮还是不收敛?别慌!这些问题的根源往往在于两个关键技术:正则化和归一化。正则化就像严格的老师,防止学生死记硬背;归一化则是标准化的教材,让学习更高效。

文章图片
#深度学习#人工智能
一文了解深度学习超参数

在深度学习中,参数和超参数是两个核心概念,它们在模型训练过程中扮演着不同的角色。。它们是模型内部的配置变量,通过训练过程中的优化算法(如梯度下降)自动调整,以最小化损失函数。参数的学习是模型训练的核心目标,其目的是让模型能够对新的数据做出准确的预测。。超参数不是从数据中学习得到的,而是根据经验和领域知识预先设定的。它们包括学习率、批次大小、网络层数、优化器选择等。超参数的选择对模型的训练速度、收敛

文章图片
#深度学习#人工智能#语言模型
大模型 | 强化学习发展的关键节点,为什么说2025年是强化学习的爆发年?

强化学习作为人工智能领域的重要分支,在过去的十年中经历了从边缘到核心的转变。从深度Q网络(DQN)的突破到AlphaGo的辉煌,再到近年来与大语言模型的结合,强化学习的技术和应用不断拓展,成为AI研究的热点。本文将带您回顾强化学习发展的关键节点,并展望其未来方向。

文章图片
#人工智能#深度学习#自然语言处理
    共 1563 条
  • 1
  • 2
  • 3
  • 157
  • 请选择