logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

AI那些趣事系列118:学习智能问数开源项目SQLBot源码

主要流程包括:用户自然语言提问,上下文收集(元数据+术语+模板),Prompt 结构化构建(规则+示例+元数据),调用大模型生成 SQL,SQL 验证/执行(有效性校验),结果返回+数据训练(迭代优化)。作用:动态获取不同数据源(MySQL/PostgreSQL/SQL Server 等)的版本、表、字段信息,作为大模型生成 SQL 的「数据字典」。:获取指定表的字段名、数据类型、字段注释,是生成

#人工智能#学习
AI那些趣事系列121:智能问数场景中使用ClickHouse处理离线3G大文件

之前在做智能问数智能体项目,输入是用户的问题和各类不同的数据源,这个数据源可能是JDBC这一类(包括PostGreSql、Mysql、Oracle、SQLServer)等,利用大模型的能力来生成SQL语句进行查询获得相关数据,输出就是用户问题对应的SQL语句、执行SQL语句查询的结果还有对应的推荐的图表。对于算法测来说,我重点关注的是如何如何获取离线大文件的元数据信息,将用户问题和元数据信息等通过

#clickhouse
AI那些趣事系列110:一文读懂 Qwen 系列模型:Qwen 系列核心算法优化技术学习笔记

模型里有 128 个独立的 “专家层”(比如 “数学专家”“代码专家”“多模态专家”),路由器会给每个 token 打分(比如 “数学题 token” 给 “数学专家” 打 90 分,“代码专家” 打 30 分),只激活分数最高的 2 个专家;处理 “周杰伦的歌” 时,不会误拆为 “周杰 / 伦的歌”。如果把 Qwen 系列比作一个 “学生”,它的成长轨迹堪称 “学霸进阶史”—— 从只会处理文本的

#人工智能#学习
<span class=“js_title_inner“>AI那些趣事系列115:一文读懂 AI Agents 与 Agentic AI:从 “单兵作战” 到 “团队协作” 的智能进化</span>

企业的 “供应链 Agentic AI 系统”,包含 “需求预测 Agent”“采购 Agent”“仓储 Agent”“物流 Agent”“库存预警 Agent”。没有 AI Agents 的单点突破,Agentic AI 就成了 “无米之炊”;“文献检索 Agent” 查找相关研究,“内容总结 Agent” 提炼核心观点,“逻辑梳理 Agent” 搭建论文框架,“格式排版 Agent” 按期刊要

#人工智能
<span class=“js_title_inner“>AI那些趣事系列117:从入门到实战:Claude Skills 彻底指南 —— 让 AI 像专业助手一样精准干活</span>

大模型的上下文窗口是有限的(比如 Claude 3 Opus 是 200k Token),如果把所有脚本、文档都一次性加载,很快就会占满窗口,导致 AI「记不住」关键信息。那么,Skills到底是什么?它不像大模型那样需要高深的算法知识,也不像传统工具那样有陡峭的学习曲线,普通人只要懂基本的流程逻辑,就能开发自己的 Skill;Claude Skills 的本质,是把「隐性经验」变成「显性能力」—

#人工智能
AI那些趣事系列117:从入门到实战:Claude Skills 彻底指南 —— 让 AI 像专业助手一样精准干活

大模型的上下文窗口是有限的(比如 Claude 3 Opus 是 200k Token),如果把所有脚本、文档都一次性加载,很快就会占满窗口,导致 AI「记不住」关键信息。那么,Skills到底是什么?它不像大模型那样需要高深的算法知识,也不像传统工具那样有陡峭的学习曲线,普通人只要懂基本的流程逻辑,就能开发自己的 Skill;Claude Skills 的本质,是把「隐性经验」变成「显性能力」—

#人工智能
AI那些趣事系列118:学习智能问数开源项目SQLBot源码

主要流程包括:用户自然语言提问,上下文收集(元数据+术语+模板),Prompt 结构化构建(规则+示例+元数据),调用大模型生成 SQL,SQL 验证/执行(有效性校验),结果返回+数据训练(迭代优化)。作用:动态获取不同数据源(MySQL/PostgreSQL/SQL Server 等)的版本、表、字段信息,作为大模型生成 SQL 的「数据字典」。:获取指定表的字段名、数据类型、字段注释,是生成

#人工智能#学习
广告行业中那些趣事系列53:多模态学习在CTR预估模型中的应用实践

导读:本文是“数据拾光者”专栏的第五十三篇文章,这个系列将介绍在广告行业中自然语言处理和推荐系统实践。本篇分享了多模态学习在CTR预估模型中的应用实践及效果展示,对于想要将多模态学习应用到CTR预估模型中的小伙伴可能有所帮助。欢迎转载,转载请注明出处以及链接,更多关于自然语言处理、推荐系统优质内容请关注如下频道。知乎专栏:数据拾光者公众号:数据拾光者摘要:本篇分享了多模态...

#大数据#编程语言#python +2
广告行业中那些趣事系列56:超实用的多模态学习模型VILT源码实践

导读:本文是“数据拾光者”专栏的第五十六篇文章,这个系列将介绍在广告行业中自然语言处理和推荐系统实践。本篇主要介绍了多模态学习模型VILT几个实用的源码实践,对于希望将VILT模型应用到业务实践的小伙伴可能有帮助。欢迎转载,转载请注明出处以及链接,更多关于自然语言处理、推荐系统优质内容请关注如下频道。知乎专栏:数据拾光者公众号:数据拾光者摘要:本篇主要介绍了多模态学习模型...

#python#java#人工智能 +2
广告行业中那些趣事系列21:从理论到实战BERT知识蒸馏

导读:本文是“数据拾光者”专栏的第二十一篇文章,这个系列将介绍在广告行业中自然语言处理和推荐系统实践。本文主要分享从理论到实战知识蒸馏,对知识蒸馏感兴趣的小伙伴可以一起沟通交流。欢迎转载...

#大数据#编程语言#python +2
    共 39 条
  • 1
  • 2
  • 3
  • 4
  • 请选择