logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

SQL语句生成智能体——vanna项目介绍

Vanna是一个基于大模型的SQL生成开源项目,利用RAG技术将自然语言转化为SQL查询语句。其核心是通过训练阶段存储数据库结构和文档到向量数据库,在提问时检索相关信息并拼接成提示词,由大模型生成相应SQL。项目支持自定义训练接口,兼容多种数据库引擎和数据分析工具,并通过正则表达式校验SQL安全性。相比pandas等内存分析方案,Vanna更适合处理海量数据,直接利用数据库引擎执行统计查询。该方案

文章图片
#sql#数据库#人工智能 +2
终于把卷积神经网络算法搞懂了!!

它通过局部感受野、权值共享和池化操作,有效提取输入数据的空间特征,大大减少了参数数量,提升了模型的表现力和计算效率,广泛应用于图像识别、目标检测、自然语言处理等领域。

文章图片
#cnn#算法#人工智能 +2
AI 智能体架构设计3阶段演进和3大关键技术对比剖析

AI智能体架构演进与关键技术解析 AI智能体发展经历了三个阶段:LLM Agent(基于提示词的娱乐化聊天机器人)、AI Agent(整合规划、记忆和工具使用能力的实用型智能体)和Muti Agent(多智能体协作系统)。三个阶段逐步解决大模型的幻觉、可控性及专业化分工问题。 关键技术方面: Function Calling:大模型调用外部工具的基础能力,但存在接口碎片化问题; MCP协议:统一工

文章图片
#人工智能#sql#数据库 +1
大模型推理的全面总结: 从DeepSeek->Kimi->豆包->Qwen3

近期大语言模型领域在推理能力方面取得重要进展。研究表明强化学习并不能真正提升模型的基础推理能力,而是通过优化输出分布来提高性能。主流模型如Seed-Thinking-v1.5、DeepSeek-R1、Kimi-K1.5和Qwen3通过不同方法增强推理能力,关键要素包括:强大的基础模型、高质量训练数据(覆盖多领域且难度均衡)、针对性设计的奖励模型,以及在预训练和后训练阶段都融入推理数据。这些研究为开

文章图片
#人工智能#深度学习#机器学习 +2
到底了