
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
—从“凭感觉下单”,到“规则 + 数据 + 模型 + 风控”的完整实战路线很多人一听到“AI 量化交易”,脑子里就自动浮现出几个词:自动赚钱、机器收割、24 小时不停印钞。但真正能跑起来的系统,从来不是一个神奇模型,而是一整条流水线:先有数据,再有规则,再有回测,再有风控,最后才轮到 AI 上场。普通人最容易踩的坑,不是不会写代码,而是顺序错了:一上来就训练模型,一上来就想做高频,一上来就想满仓实
把全文浓缩成一句话:AI 时代,普通人最该抢的,不是某个听起来很热的名词,而是那些能立刻接进自己工作、经验和收入的机会。你可以先从本职工作提效开始;可以把经验做成内容;可以去做 AI 服务;可以搭流程自动化;可以做知识产品;可以做审校把关;可以帮电商和本地商家提效;也可以从一个微型应用开始。路很多,关键不是哪条最完美,而是哪条你今天就能走第一步。别再只是旁观 AI。真正的机会,不属于最焦虑的人,也
很多人一听“向量数据库”,感觉很抽象。其实不用想复杂。用户ID、姓名、手机号、订单号、金额、状态select * from user where name = '张三';这种叫:精确匹配。但是AI场景不一样。我借款还不上怎么办?用户无法按期偿还贷款时,可查看延期还款规则。两个句子字面不一样,但意思接近。传统数据库很难查出来。“我借款还不上怎么办?↓这串数字就叫:向量。如果两句话意思接近,它们的向量
不要上来就写 Prompt,而是先定义结果结构。"slots": {},这里每个字段都有明确作用:intent:用户意图confidence:置信度slots:关键信息needHuman:是否需要人工reason:判断原因这样下游系统就能稳定消费。把不确定的生成结果,变成确定的业务结果。没有后处理的大模型应用,通常只能做 Demo。有后处理的大模型应用,才有机会真正上线。最后记住这 6 句话:第一
Prompt工程可以理解为大模型时代的“新型需求说明书”。一个好的Prompt,应该包含:角色任务背景约束格式示例评判标准异常处理真正落地时,还要配合:模板库版本管理测试集日志追踪灰度发布持续评测所以,Prompt工程不是玄学,也不是一句“你是专家”就能解决的技巧。把模糊需求变成清晰指令,把随机输出变成稳定交付,把一次性问答变成可复用能力。
大模型日志系统不是简单的“打印几行日志”。它应该是一套完整的 AI 可观测体系。一、请求可追踪二、Prompt 可回溯三、RAG 可分析四、Agent 可复盘五、Token 可计费六、质量可评估七、安全可审计八、badcase 可沉淀九、评测集可迭代十、线上效果可持续优化普通业务日志解决的是:系统有没有挂?大模型日志系统解决的是:AI 为什么这么回答?回答得好不好?成本高不高?有没有安全风险?下次
大模型的数据清洗,是大模型工程里非常核心的一环。数据采集→ 格式标准化→ 文本抽取→ 去噪→ 去重→ 质量过滤→ 安全过滤→ 隐私脱敏→ 事实校验→ 评测集去污染→ 数据配比→ 人工抽检→ 持续迭代对于预训练来说,数据清洗决定模型基础能力。对于 SFT 来说,数据清洗决定模型是否听话、是否专业。对于 DPO/RLHF 来说,数据清洗决定模型偏好是否正确。对于 RAG 来说,数据清洗决定知识库能不能
在机器学习领域,朴素贝叶斯是几十年来应用最广泛的分类算法之一。所有涉及的特征(指文本中的词汇、表格中的列等)在给定类别的情况下,彼此完全独立从源头说起核心源头是贝叶斯定理本身——表达式P(H∣D) = P(D∣H) P(H) / P(D),统一整座学术大厦的核心支柱。直系算法派朴素贝叶斯:假设所有特征彼此独立,牺牲精度保留速度,文本分类领域战斗力极强。贝叶斯网络:增加节点之间的有向依赖结构,支持因
看到这里你已经明白了,虽然新技术层出不穷(PEFT、LoRA、Adapter等),它们执行起来的秘密武器就是模型冻结。下面这张总结会让你明白冻结在多维度上的巨大威力:技术维度硬核效果数据分析技术机制计算资源冻结大部分特征层,显存占用降低80%以上阻断反向传播计算图训练速度训练时间从几天压缩到几小时梯度计算和参数更新直线减少模型性能对于小数据任务,提升测试集精度6%以上冻结层保留了原始的教科书级特征
前向传播就是把输入数据逐层变换,得到预测结果。这就像流水线上的机械臂,每一层都在对输入做一次线性组合+一次非线性挤压。损失函数用一个简单的数字告诉模型:现在的答案和真实答案差多远。反向传播则是一条精妙的误差配送路线——利用链式法则,从输出端开始,将损失的责任一层层分配到每一个权重头上,告诉每个权重“你应该增加还是减少,以及多少”。梯度下降根据反向传播送来的梯度,微调每一个权重,让下一次前向传播的结







