logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

SpringAi-RAG知识库【来源追溯】实现完整方案+代码

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大

文章图片
#人工智能#架构#自动化 +2
别再花冤枉钱了!2025年12月全球大模型API最新比价与选型指南

看完眼花缭乱的价格表,作为企业决策者或开发者,到底该怎么选?💡 2025年的选型黄金法则:能用 Flash/V3 解决的,绝不上 Pro/Max!场景一:日常主力/高并发C端应用(追求极致性价比)🇨🇳或 🇺🇸。理由:它们已经足够好,且便宜到几乎可以忽略成本。场景二:需要深度思考/复杂推理/数学计算**不差钱选:**OpenAI o1。**精明选:**(价格仅为 o1 的 4%左右,但能提

文章图片
#人工智能#科技#机器学习 +2
面试官怒怼:你的Text2SQL只是个玩具!工业级实现原来是这样

文章从面试官视角剖析了Text2SQL从demo到工程级实现的差距。强调Text2SQL应作为Agent的只读工具节点,而非简单对话能力。提出动态Schema裁剪、歧义显式消解、SQL安全校验、结果验证等工程化关键点,以及日志和Badcase闭环对系统持续优化的重要性。真正的Text2SQL价值在于被调度、约束、验证和复盘,而非仅生成SQL。

#oracle#数据库#人工智能 +2
震惊!20行代码实现完整Agent能力,大模型开发者直呼内行:Bash is All You Need!小白必学的极简AI开发神操作!

文章展示了Agent技术的演进历程,从v1到v3版本后,作者逆向思维开发出仅20行核心代码的v0版本。通过Bash作为meta接口和递归调用机制,实现了完整的Agent能力包括子代理。核心洞察是"一个工具+递归=完整Agent",证明了复杂能力可从简单规则中涌现,为AI开发者提供了极简而强大的实现思路。

#bash#人工智能#chrome +3
面试官问:为什么要用 PPO / DPO / GRPO?SFT 真的不够吗?

文章揭示SFT与RLHF在大模型训练中的本质区别:SFT关注token级优化,易饱和且局限于数据分布;RLHF关注整段输出,通过探索突破数据上限。许多简历堆砌高级名词却说不清原理,面试中暴露问题。真正拉开差距的是体系思维而非知识点,理解训练视角和工程实践才能做出有效决策。

#开源#3d#人工智能 +1
大模型“内卷“新方向:密度定律揭秘,小模型逆袭,开发者如何应对AI成本变革?

研究提出"能力密度"概念,发现LLM能力密度每3.5个月翻倍,实现同等性能所需参数与推理成本指数下降。这意味着端侧智能将提前爆发,小模型可逼近甚至超越大模型。高密度模型源于更优训练数据、高效结构和先进算法,而非简单压缩。这一"密度革命"将改变AI开发方向,从单纯扩大参数规模转向追求更高效率。

文章图片
#人工智能#架构#自动化 +3
【AI黑科技】Multi-Query多路召回:RAG检索的“作弊代码“,小白也能快速上手!

Multi-Query(多路召回)是RAG中提升检索召回率的关键策略,通过让大语言模型基于原始问题生成3-5个不同角度的查询变体,并行检索后融合结果,显著提高相关文档召回概率。然而,其局限性包括可能引入无关信息与噪音,以及过度召回导致的上下文溢出问题,需要通过合理设置和结果过滤来优化。

文章图片
#人工智能#科技#机器学习 +3
大模型开发新姿势:一文搞定向量嵌入+多模态检索+数据库优化,小白秒变AI大神!

本文详解大模型知识库索引构建四大核心技术:向量嵌入实现文本图像数字化;多模态嵌入融合跨模态语义;向量数据库提供高效存储检索;索引优化通过上下文扩展和结构化提升精度。结合代码示例,从理论到实践全面展示RAG系统构建,助力开发者打造高效智能知识库。

文章图片
#数据库#人工智能#机器学习 +2
15款大模型透明度测评:两款允许用户撤回数据不投喂AI(文末附报告领取方式)

15款被测国产大模型应用中,仅有DeepSeek主动说明训练数据的大致来源,其他被测大模型仍相当不透明。两款大模型DeekSeek、腾讯元宝提供退出开关,允许用户选择是否将所有数据用于优化体验。这是南都数字经济治理研究中心实测15款国产大模型的最新发现。2025年12月18日下午,南方都市报在北京举办第九届啄木鸟数据治理论坛,会上重磅发布4万余字的《生成式AI落地应用:透明度测评与案例分析报告(2

文章图片
#人工智能#机器学习#深度学习 +1
收藏!LangGraph+FastAPI打造生产就绪的LLM API服务,超详细教程

本文详细介绍了如何结合LangGraph和FastAPI,将大语言模型(LLM)工作流封装为生产就绪的REST API服务。从项目设置、构建简单工作流,到添加错误处理、重试机制、输入验证和日志记录等生产级功能,再到使用FastAPI暴露工作流、测试API,以及部署扩展方案。通过这一系列步骤,读者可以学会构建可从任何地方访问的可扩展AI智能体服务,为开发聊天机器人、文档处理器等AI应用奠定基础。擅长

文章图片
#fastapi#人工智能#AI
    共 1340 条
  • 1
  • 2
  • 3
  • 134
  • 请选择