
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
主要流程包括:用户自然语言提问,上下文收集(元数据+术语+模板),Prompt 结构化构建(规则+示例+元数据),调用大模型生成 SQL,SQL 验证/执行(有效性校验),结果返回+数据训练(迭代优化)。作用:动态获取不同数据源(MySQL/PostgreSQL/SQL Server 等)的版本、表、字段信息,作为大模型生成 SQL 的「数据字典」。:获取指定表的字段名、数据类型、字段注释,是生成
之前在做智能问数智能体项目,输入是用户的问题和各类不同的数据源,这个数据源可能是JDBC这一类(包括PostGreSql、Mysql、Oracle、SQLServer)等,利用大模型的能力来生成SQL语句进行查询获得相关数据,输出就是用户问题对应的SQL语句、执行SQL语句查询的结果还有对应的推荐的图表。对于算法测来说,我重点关注的是如何如何获取离线大文件的元数据信息,将用户问题和元数据信息等通过
模型里有 128 个独立的 “专家层”(比如 “数学专家”“代码专家”“多模态专家”),路由器会给每个 token 打分(比如 “数学题 token” 给 “数学专家” 打 90 分,“代码专家” 打 30 分),只激活分数最高的 2 个专家;处理 “周杰伦的歌” 时,不会误拆为 “周杰 / 伦的歌”。如果把 Qwen 系列比作一个 “学生”,它的成长轨迹堪称 “学霸进阶史”—— 从只会处理文本的
企业的 “供应链 Agentic AI 系统”,包含 “需求预测 Agent”“采购 Agent”“仓储 Agent”“物流 Agent”“库存预警 Agent”。没有 AI Agents 的单点突破,Agentic AI 就成了 “无米之炊”;“文献检索 Agent” 查找相关研究,“内容总结 Agent” 提炼核心观点,“逻辑梳理 Agent” 搭建论文框架,“格式排版 Agent” 按期刊要
大模型的上下文窗口是有限的(比如 Claude 3 Opus 是 200k Token),如果把所有脚本、文档都一次性加载,很快就会占满窗口,导致 AI「记不住」关键信息。那么,Skills到底是什么?它不像大模型那样需要高深的算法知识,也不像传统工具那样有陡峭的学习曲线,普通人只要懂基本的流程逻辑,就能开发自己的 Skill;Claude Skills 的本质,是把「隐性经验」变成「显性能力」—
大模型的上下文窗口是有限的(比如 Claude 3 Opus 是 200k Token),如果把所有脚本、文档都一次性加载,很快就会占满窗口,导致 AI「记不住」关键信息。那么,Skills到底是什么?它不像大模型那样需要高深的算法知识,也不像传统工具那样有陡峭的学习曲线,普通人只要懂基本的流程逻辑,就能开发自己的 Skill;Claude Skills 的本质,是把「隐性经验」变成「显性能力」—
主要流程包括:用户自然语言提问,上下文收集(元数据+术语+模板),Prompt 结构化构建(规则+示例+元数据),调用大模型生成 SQL,SQL 验证/执行(有效性校验),结果返回+数据训练(迭代优化)。作用:动态获取不同数据源(MySQL/PostgreSQL/SQL Server 等)的版本、表、字段信息,作为大模型生成 SQL 的「数据字典」。:获取指定表的字段名、数据类型、字段注释,是生成
导读:本文是“数据拾光者”专栏的第五十三篇文章,这个系列将介绍在广告行业中自然语言处理和推荐系统实践。本篇分享了多模态学习在CTR预估模型中的应用实践及效果展示,对于想要将多模态学习应用到CTR预估模型中的小伙伴可能有所帮助。欢迎转载,转载请注明出处以及链接,更多关于自然语言处理、推荐系统优质内容请关注如下频道。知乎专栏:数据拾光者公众号:数据拾光者摘要:本篇分享了多模态...
导读:本文是“数据拾光者”专栏的第五十六篇文章,这个系列将介绍在广告行业中自然语言处理和推荐系统实践。本篇主要介绍了多模态学习模型VILT几个实用的源码实践,对于希望将VILT模型应用到业务实践的小伙伴可能有帮助。欢迎转载,转载请注明出处以及链接,更多关于自然语言处理、推荐系统优质内容请关注如下频道。知乎专栏:数据拾光者公众号:数据拾光者摘要:本篇主要介绍了多模态学习模型...
导读:本文是“数据拾光者”专栏的第二十一篇文章,这个系列将介绍在广告行业中自然语言处理和推荐系统实践。本文主要分享从理论到实战知识蒸馏,对知识蒸馏感兴趣的小伙伴可以一起沟通交流。欢迎转载...







