严文文-Chris 个人主页

@yanwenwennihao

严文文-Chris

2023-08-09 15:59:14 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

命令强制删除nodejs

如果之前安装了node,想要重新安装,就用命令强制删除一.rmdir 删除整个目录好比说我要删除 222 这个目录下的所有目录和档案，这语法就是：rmdir /s/q 222其中：/s 是代表删除所有子目录跟其中的档案。/q 是不要它在删除档案或目录时，不再问我 Yes or No 的动作。要删除的目录前也可以指定路径，如：rmdir /s/q d:\123\abc...

【什么是知识图谱？】

知识图谱是一种以图结构（节点+边）组织和表达知识的方法，包含实体、关系和属性。其构建涉及数据收集、知识抽取、融合与存储，应用覆盖搜索、问答、推荐等多个领域。知识图谱可与RAG（检索增强生成）结合，通过语义扩展和逻辑推理提升大模型回答的准确性与可解释性。核心流程包括数据来源→知识构建→存储管理→应用交互，最终实现结构化知识的系统化利用。

#知识图谱 #人工智能

【增量预训练CPT是什么？过程？适用场景？】

增量预训练就像给你的 AI 老师。

#人工智能

【奥卡姆剃刀原理-如何理解云计算和边缘计算关键字摘取】

而如果本地的那些摄像头要分析处理的任务太重，根本不是一台能塞进摄像头的计算机能解决的，那么干脆就在距离最近的 10 个摄像头的物理中心点，部署一组服务器。在远离云服务器的地方，搭建一个小型的云服务，然后让附近的设施和小型云服务器相连，让整个网络构成 mesh 结构。今天，这类做法又被叫作边缘计算中的雾计算。你发现了吗？不止是云计算、边缘计算，连边缘计算里的不同网络结构、边缘计算的分类也都可以通过奥

#云计算 #边缘计算 #人工智能

【大模型早期融合的标记化架构】

👉 系统化总结：早期融合的标记化架构是在多模态大模型的早期融合策略里，用 token 统一表示不同模态，从而让一个模型在共享空间中直接学习模态间关系。早期融合的标记化架构不是孤立存在的，它处于多模态 AI 发展的大背景中。👉 全局化总结：早期融合 + 标记化架构的核心就是。这条链路就是早期融合标记化架构的工作逻辑。

#人工智能

大模型是如何生成回复的？背后的逻辑是什么？

大模型生成回复的核心逻辑是：通过Transformer架构将输入文本转换为向量表示，利用自注意力机制理解上下文关系，逐词预测概率分布，并采用采样策略生成连贯输出。整个过程结合海量数据训练和人类反馈优化，使其成为能捕捉语言规律的概率预测器。关键步骤包括：文本编码、语境建模、概率预测、采样解码和人类对齐。

#语言模型

【大模型有哪些训练阶段？】

大模型（如 GPT、BERT 等）训练一般可以分为以下，每个阶段都承担着不同的职责，共同推动模型从“语言新手”成长为“多任务专家”。

大模型是如何生成内容的？

步骤描述1️⃣将输入文本切分成 token2️⃣利用 Transformer 理解上下文3️⃣预测下一个 token（词）4️⃣重复预测，直到生成完成🎲通过 sampling 策略控制风格和多样性。

【大模型参数显存小结】

大模型训练中的显存占用主要来自三部分：模型参数显存、激活显存和优化器显存。模型参数显存存储权重和梯度，用于前向/反向传播；激活显存保存中间计算结果，是梯度计算的基础；优化器显存存储动量等状态信息，用于参数更新。三者缺一不可，共同支撑模型训练过程。显存优化技术如参数分片、混合精度训练等可减少占用。前向传播计算预测值，反向传播通过链式法则计算梯度，优化器利用动量和方差调整参数更新方向与幅度。

#人工智能

【人工智能AI、机器学习ML、深度学习DL、基础模型FM、LLM、GPT、Generative AI 分别是什么?他们之间的关系是什么？】

本文系统梳理了人工智能领域的关键概念及其层级关系。人工智能（AI）是总括概念，机器学习（ML）是其子集，通过数据自动学习；深度学习（DL）作为ML的分支，采用神经网络；基础模型（FM）是在海量数据上预训练的大模型；大语言模型（LLM）是FM的一种，专注自然语言处理，GPT是其代表架构；生成式AI（Generative AI）则涵盖跨模态内容生成，包括文本、图像、音频和视频。这些概念呈现清晰的树状层

#人工智能 #机器学习 #深度学习

共 54 条

请选择