
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
Nanobot**是香港大学数据科学实验室(HKUDS)开源的一个项目,号称是 OpenClaw 的精简版实现。**整个框架核心代码只有约 4000 行**,比 OpenClaw 小了 99%,但功能一点都不含糊:工具调用、定时任务、记忆系统、多模型兼容、多平台支持,该有的都有。

你是不是也踩过这种坑:本地测试跑得飞快,上线之后用户说「你这 AI 咋这么慢」;或者月初信心满满上了新功能,月底对账单看到数字翻了三倍,却找不到是哪儿吃掉了那么多 Token?

最近一位三年后端转AI方向的朋友,连拿三个Agent岗offer,最高包和最低包差了**40万**。我把他的面经和我收集的大厂真题合在一起,整理出这份面试指南——**18个高频问题,每个都给你最精炼的回答思路**。

每到节假日,各大购物网站平台都会发放各种“秒杀”优惠券,从一两块到两三百甚至“零元购”的都有,但问题是,自己永远抢不到。不值钱的优惠券一堆人推荐,真正好的优惠券你就得花时间去抢,而抢到的概率几乎为零。如下图:对于商家来说,初心是好的,限时秒杀优惠券则是通过优惠营造稀缺氛围,节日促销的时候回馈老用户,以让利获得更多销量,用户购买的开心,口碑传播动力就越大,互利共赢的买卖。能够真正抢到好的优惠券,关键

想拥有自己的专属 AI 模型,却被动辄数百 GB 的显存需求劝退?

想拥有自己的专属 AI 模型,却被动辄数百 GB 的显存需求劝退?

大语言模型之所以能在不同任务上表现出很强的迁移能力,一个重要原因是:文本可以被切分成 token。一句话可以拆成词、子词或符号;图像可以被看成像素或图像块。这些 token 构成了模型能够反复使用的“基础单位”。

在之前的 Naive RAG 阶段,AI 学会了一件事:回答问题前,先去资料库里翻一翻。但很快,人们发现这个“翻一翻”的动作太粗糙了——用户说一句口语,它找不到;用户问一个专业术语,它也找不到。就像一个刚学会用索引卡片的小管理员,稍微复杂一点的查询就束手无策。

很多团队把 80% 的精力花在调 Embedding 模型、优化 Prompt、换 LLM 上,却忽略了决定 RAG 上限的关键环节——**文档预处理**。分块方式差,再好的检索算法也召回不准;文本没清洗,Embedding 模型产生的向量就是"带噪声"的。本文以 TMC 差旅财务系统为业务背景,系统梳理文档预处理的全流程技术。

这周我把 Unsloth Studio 这个新工具试了下,结论是:**真的可以零代码跑通一次完整微调**。从加载模型、上传数据集、调超参到导出模型,全在浏览器界面里点。我用 Qwen3.5-4B 跑了一个"客服话术"风格化微调,整个流程不到一小时,显存峰值才 6GB 多一点。








