
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
传统 MLP 是。
branch这个命令以前叫/fork,现在改名成/branch了,打/fork还是能用,会自动跳到/branch。生成一份HTML报告,分析你过去一个月使用Claude Code的习惯,包括你最常用哪些命令,你有哪些重复性的操作模式,然后给你推荐一些自定义命令和Skills。比如我现在我开发了一个功能,我觉得不好,想撤销,我就可以先打/rewind,然后把这个会话里面的历史拽出来。在终端里打/rc
论文的核心论点是:大型语言模型,无论训练在多少文本上,本质上都是在做统计模式匹配——它们学会了哪些词序列在训练语料里经常一起出现,然后在生成时复现这些模式。就像一只鹦鹉,听到了足够多的对话之后,能够在合适的时机说出”你好”或”再见”,但它不理解这些词的意义2023年,Hodel和West做了一个简单的测试。他们拿GPT-3做字母串类比推理——这是Webb等人在2023年声称GPT-3已经”涌现”出
跑完整个 Notebook,相当于你已经独立完成了一次完整的模型微调。具体来说,你手上会多出这样几样成果:关机前的“安全撤退”两步走正式关闭环境 确认代码文件下载到你本地电脑后,回到网页的 Profile(个人主页) ,找到 Active Instance 区域,点击红色的 Destroy Instance 按钮。微调(Fine-tuning)微调的真实威力,看下例子就懂:耶鲁大学用微调后的 Ge
跑完整个 Notebook,相当于你已经独立完成了一次完整的模型微调。具体来说,你手上会多出这样几样成果:关机前的“安全撤退”两步走正式关闭环境 确认代码文件下载到你本地电脑后,回到网页的 Profile(个人主页) ,找到 Active Instance 区域,点击红色的 Destroy Instance 按钮。微调(Fine-tuning)微调的真实威力,看下例子就懂:耶鲁大学用微调后的 Ge
它和 Google 那款闭源、收费的 Gemini 3 用的是同一套底层技术,所以你可以把它看成 Gemini 3 的"开源师弟"——区别在于,Gemma 把模型权重公开放了出来,而且用的是商业友好的 Apache 2.0 许可 ,意味着 不光能免费下载,还能免费商用。别看个头小,Gemma 4 这一代主打的就是" 单位参数下的高智能 "——按 Google 官方说法,它家最大的 31B 模型在权
它和 Google 那款闭源、收费的 Gemini 3 用的是同一套底层技术,所以你可以把它看成 Gemini 3 的"开源师弟"——区别在于,Gemma 把模型权重公开放了出来,而且用的是商业友好的 Apache 2.0 许可 ,意味着 不光能免费下载,还能免费商用。别看个头小,Gemma 4 这一代主打的就是" 单位参数下的高智能 "——按 Google 官方说法,它家最大的 31B 模型在权
要理解智能体的运作,我们必须先理解它所处的任务环境。在人工智能领域,通常使用PEAS模型来精确描述一个任务环境,即分析其性能度量(Performance)环境(Environment)执行器(Actuators)和传感器(Sensors)。以上文提到的智能旅行助手为例,下表1.2展示了如何运用PEAS模型对其任务环境进行规约。在实践中,LLM智能体所处的数字环境展现出若干复杂特性,这些特性直接影响
混淆矩阵(也称误差矩阵)是机器学习和深度学习中表示精度评价的一种标准格式,常用n行n列的矩阵形式来表示。其列代表的是预测的类别,行代表的是实际的类标,以一个常见的二分类的混淆矩阵为例。我们会发现二分类的混淆矩阵包括TP, FP, FN, TN,其中TP为True Positive,True代表实际和预测相同,Positive代表预测为正样本。同理可得,False Positive (FP)代表的是
多态大模型(MLLM,Multimodal Large Language Model)尝试进一步处理图片、文档、截图、表格、视频帧、语音等多种输入形式。(第七章 OpenAI 兼容接口、第八章 Gradio Demo、第九章 Agent),完全不需要 PyTorch,可以跳过本节。能画出 感知 → 规划 → 工具 → 记忆 的多模态 Agent 草图,并整理出一份自己的实践优先级清单(第 9~10







