MYH516 个人主页

@mayaohao

MYH516

2022-10-10 19:10:51 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

langchain

框架将核心功能拆分为多个模块（如提示模板、记忆系统、工具调用、链（Chains）、代理（Agents）等），开发者可以像搭积木一样组合这些模块，灵活扩展功能。LangChain 封装了大量与语言模型交互的细节（如提示工程、API 调用、上下文管理等），提供了统一的接口，让开发者无需重复编写基础代码，快速构建复杂的 LLM 应用（如聊天机器人、问答系统、智能代理等）。当应用出现问题（如输出不符合预期

大数据hadoop hdfs 读写流程

1、HDFS读流程1、首先调用FileSystem对象的open()方法，其实获取的是一个DistributedFileSystem的实例。2、DistributedFileSystem用RPC调用元数据节点，得到文件的数据块信息，对于每一个数据块，元数据节点返回保存数据块的数据节点的地址。3、会返回一个FSDataInputStream对象，可以方便的管理datanode和namenode数据流

手动给中文分词和直接用神经网络RNN做有什么区别

你的代码使用 RNN 实现分词，正是利用了神经网络在上下文建模和自动特征提取上的优势，尤其适合处理未登录词和复杂语义场景。而神经网络分词更适合。

#神经网络 #中文分词 #rnn

mamba架构和transformer区别

Mamba 架构和 Transformer 架构存在多方面的区别，具体如下：

#架构 #transformer #深度学习

基于 BERT 的文本分类系统

需要一个基于历史标注数据的自动分类系统，将领导们的 issues 分配到三个预定义的类别中。这种场景非常适合使用自然语言处理（NLP）中的文本分类技术。

#bert #分类 #人工智能

KTransformer 和transformer区别

Transformer 是一种基于注意力机制的深度学习模型架构，在自然语言处理等领域有广泛应用4。KTransformers 则是清华大学 KVCache.AI 团队联合趋境科技推出的一个开源项目，主要是对 Transformer 模型在本地部署等方面进行优化的框架2。

#人工智能

在中文中，BPE 处理生僻词

中文 BPE 通过以汉字为基础单元，结合字节级兜底机制大部分生僻词可拆分为已知汉字（基础单元）；极端罕见字符通过 UTF-8 字节拆分，用字节级 token 覆盖；本质上与英文 BPE 一致：不依赖完整词的存在，而是通过更小的、可复用的子单元（汉字 / 字节）来表示任意文本，包括生僻词。这也是为什么中文大模型能处理训练数据中未见过的生僻词 —— 它们被拆解为了模型 “认识” 的基础单元。

#人工智能

豆包和deepseek 元宝百度ai区别是什么

豆包、DeepSeek、元宝和百度 AI 有以下区别：

#transformer

大模型（如 GPT、LLaMA 等）采用 “一个字一个字预测” 的核心逻辑

大模型 “一个字一个字预测”，不是 “技术落后”，而是对语言本质（时序性、上下文依赖）的贴合，对概率模型原理（自回归、概率分布）的遵循，以及对工程可行性（计算效率、内存限制）的妥协。它用 “线性的生成步骤”，换来了 “可控的计算成本” 和 “高质量的语义连贯”，最终成为当前大模型文本生成的核心范式。

BPE在nlp的使用

在自然语言处理（NLP）中，BPE（Byte Pair Encoding，字节对编码）是，其核心价值是解决 “基于词的分词” 的词汇外（OOV）问题和 “基于字符的分词” 的语义颗粒度不足问题，为语言模型提供更高效、更灵活的输入表示。

#自然语言处理 #人工智能

共 28 条

请选择