logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

AI大模型的基本知识

让机器执行需要人类智能的任务阶段:早期阶段:专家系统 依赖人设定的规则机器学习时代:数据参数训练深度学习时代:用神经网络模拟人脑复杂结构 比如图像识别和处理大模型时代:以规模数据和大算力为基础分词。

#人工智能
Text2SQL 自助式数据报表开发(Chat BI)

Text2SQL 自助式数据报表开发(Chat BI)Q: 自助式报表是bi吗?A: 对的 主要是 Text2SQL, 自然语言撰写SQL,进行数据表查询,可视化结果等。Q: 是否必须安装mysqlA: 可以本地安装MySQL,或使用数据库的云服务器Q:PDF里面复杂表哥不好提取内容,怎么搞?A: 对,表格里可能会有复杂的情况,比如跨页或合并单元格的MinerU 可以将PDF中的图表 图片 或公式

#人工智能
使用alpaca-cleaned数据集微调qwen3-4B

texts = []# 必须添加EOS_TOKEN,否则生成会无限继续per_device_train_batch_size = 2,# 每个设备的训练批次大小gradient_accumulation_steps = 4,# 梯度累积步数warmup_steps = 5,# 预热步数max_steps = 60,# 最大训练步数learning_rate = 2e-4,# 学习率。

#人工智能
Agent智能体系统的设计

Q:老师 langchain-agent 和Qwen-agent,各有什么特性?LangChain 自带了很多 Agent,比如SQL Agent也比较适合工作流的编排Qwen-Agent 更偏向于Agent开发,自主调用 RAG,工具的能力,代码比较简洁Q:老师,mcp的sse和npx的区别是什么,还有哪些协议?sse 通过网页进行访问,事件驱动Q:在场景下如何选择到底是用Langchain还是

#人工智能
MCP与A2A的应用

可以在IDE中设置 mcp.json,配置好后IDE的对话Agent就能用配置的mcp了:“args”: [“-y”,],“env”: {},需要找一个Agent,设置 mcp的参数 mcp.json。

#人工智能
Function Calling与智能Agent开发

1 拓展模型能力大模型本身无法直接调用外部系统(如数据库,计算工具),但通过调用预设函数,可以完成实时获取(天气 股价 新闻)复杂计算(数学运算 代码执行)操作外部系统(发送邮件,控制智能设备)2 结构化输出模型可将用户自然语言请求转化为结构化参数,传给函数。例如:用户说:明天北京天气如何?模型可以识别其中的参数:北京 202508243 动态决策流程模型可根据上下文决定是否以及何时调用函数,甚至

#人工智能
RAG高级技术

RAG高级技术Q:embedding时,markdown和txt 有何区别?embedding时markdown比txt损失更小 如果是PDF PPI建议转成Q:公司做运维场景的智能体 用什么框架好?思考运维智能体有哪些功能 需搭建哪些toolRAG:从1000万众=>召回(关键词)100个=>重排(重排模型相对较大,计算量较大)推荐系统:1000万=>召回100个=>重排召回可以是多渠道的,可以

#人工智能
RAG技术与应用

RAG技术与应用如何让大模型的回答更准确?首先优化提示词,然后补充背景知识RAG,最后是微调SFT。

#人工智能
DeepSeek的使用与提示词工程

阿里的零码 lingma IDE可以用用;对标 cursorQwen3-coder 跟Claude 齐平大模型的部署工具:011ama个人学习用;V11m企业用 支持多人并发。

#人工智能
AI大模型的基本知识

让机器执行需要人类智能的任务阶段:早期阶段:专家系统 依赖人设定的规则机器学习时代:数据参数训练深度学习时代:用神经网络模拟人脑复杂结构 比如图像识别和处理大模型时代:以规模数据和大算力为基础分词。

#人工智能
    共 19 条
  • 1
  • 2
  • 请选择