
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
混淆矩阵(也称误差矩阵)是机器学习和深度学习中表示精度评价的一种标准格式,常用n行n列的矩阵形式来表示。其列代表的是预测的类别,行代表的是实际的类标,以一个常见的二分类的混淆矩阵为例。我们会发现二分类的混淆矩阵包括TP, FP, FN, TN,其中TP为True Positive,True代表实际和预测相同,Positive代表预测为正样本。同理可得,False Positive (FP)代表的是
多态大模型(MLLM,Multimodal Large Language Model)尝试进一步处理图片、文档、截图、表格、视频帧、语音等多种输入形式。(第七章 OpenAI 兼容接口、第八章 Gradio Demo、第九章 Agent),完全不需要 PyTorch,可以跳过本节。能画出 感知 → 规划 → 工具 → 记忆 的多模态 Agent 草图,并整理出一份自己的实践优先级清单(第 9~10
branch这个命令以前叫/fork,现在改名成/branch了,打/fork还是能用,会自动跳到/branch。生成一份HTML报告,分析你过去一个月使用Claude Code的习惯,包括你最常用哪些命令,你有哪些重复性的操作模式,然后给你推荐一些自定义命令和Skills。比如我现在我开发了一个功能,我觉得不好,想撤销,我就可以先打/rewind,然后把这个会话里面的历史拽出来。在终端里打/rc
看似优化模型建立整数规划模型用优化软件、启发式方法、精确方法求解建立图论和组合优化模型用组合优化方法、启发式方法求解建立博弈论模型数据统计分析与可视化- 数据拟合、参数估计、插值、数据的标准化、去伪补全相关度分析、分类、聚类等最优化理论和方法线性规划图论与组合优化:最小树,最短路,最大流,TSP,背包非非线性规划整数规划:分支定界法、分解算法、割平面法NP-难问题的启发式方法:模拟退火、神经网络、
这就是为什么有时 AI 引用某个网页作为依据,但你实际去看那个网页,会发现内容并不支持 AI 的结论。
tmux ls回溯logctl+b上下键。
Casual Language Model,下简称 CLM。Decoder-Only(GPT):像 “作家”,擅长从前往后 “创作” 内容,适合写文章、生成对话等 NLG 任务。Encoder-Only(BERT):像 “读者”,擅长 “理解” 现有文本的含义,适合阅读理解、语义匹配等 NLU 任务。Encoder-Decoder(T5):像 “翻译官”,既能理解输入(Encoder),又能生成输
这五个问题,本质上都在追问同一个底层矛盾:仅凭观测数据,我们到底能学到多少因果知识?它的边界在哪里?忠实性假设、等价类问题:是在问“观测数据本身的信息局限性”。SCM参数学习、LLM因果推理:是在问“我们的模型/算法,能不能突破这种局限性”。跨分布泛化失败:是在问“这种局限性会在实践中如何体现”。
论文的核心论点是:大型语言模型,无论训练在多少文本上,本质上都是在做统计模式匹配——它们学会了哪些词序列在训练语料里经常一起出现,然后在生成时复现这些模式。就像一只鹦鹉,听到了足够多的对话之后,能够在合适的时机说出”你好”或”再见”,但它不理解这些词的意义2023年,Hodel和West做了一个简单的测试。他们拿GPT-3做字母串类比推理——这是Webb等人在2023年声称GPT-3已经”涌现”出
从应用伦理角度,词向量中的社会偏见(如 vec(Doctor) 更接近 vec(Man),vec(Nurse) 更接近 vec(Woman))会放大现实中的性别歧视、种族歧视,导致 AI 系统做出不公平决策(如简历筛选模型优先推荐男性候选人)。







