Learn Forever 个人主页

@qq_41466440

Learn Forever

2022-09-16 17:39:46 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

【fastText】fastText 工具介绍

fastText = Word2Vec + 子词建模 + 简单高效的文本分类如果你需要一个快速的、工业可用的词向量或分类器，它依然是一个非常棒的选择。

#transformer #人工智能

【fastText】fastText 文本分类

fastText是一种高效的文本分类工具，其核心原理是将词向量与线性分类器结合，通过监督学习训练。它采用简洁的文本格式（标签以__label__开头），支持快速训练和预测，适用于情感分析、新闻分类等场景。fastText优势在于训练速度快、模型体积小，支持多语言和进阶技巧如2-gram优化。工业中常用于评论分析、商品分类等低延迟需求场景。该工具通过简单接口实现高效文本分类，是处理大规模语料的理想选

#分类 #人工智能 #机器学习

BERT 预训练模型

BERT 开启了 NLP 的新时代，是所有预训练语言模型的“奠基之作”。今天，无论你是做文本分类、情感分析、阅读理解，还是更复杂的自然语言推理，BERT 仍是你可靠的基座模型之一。

#bert #自然语言处理 #人工智能

【NLP】Teacher Forcing

教师强迫是一种有效的训练策略，可以加速 Seq2Seq 模型的收敛，同时减少模型在生成过程中因错误产生的连锁反应。然而，在使用教师强迫时，开发者需要平衡其优缺点，以便确保模型在实际应用中的有效性。理解如何在模型中实现和调整教师强迫是提升生成模型性能的重要一步。

#自然语言处理 #人工智能 #深度学习

【fastText】fastText 训练词向量

fastText 可以看作是Word2Vec + 子词分片的组合，同时保持超快的速度和小巧的文件体积。它是一个非常务实、工程化的词向量方案，尤其在海量文本和多语言环境下表现优秀。

#深度学习 #人工智能

【Prompt】Prompt介绍与示例

【代码】【Prompt】Prompt介绍与示例。

【MCP】MCP基本概念与核心原理详解

MCP协议通过标准化、模块化与安全设计，为AI应用提供了“万能插头”式的基础设施。无论是开发者构建复杂工作流，还是企业实现跨系统自动化，MCP均展现出强大的潜力。随着开源社区的壮大（GitHub已有超1100个项目），MCP或将成为AI时代不可或缺的数字总线。MCP开发案例及场景实践将在后续文章中进一步完善。

#人工智能

ELMo词向量模型

ELMo（Embeddings from Language Models）是 2018 年由 AllenNLP 团队提出的上下文相关词向量模型，它在当时显著提升了多个自然语言处理任务的表现，为后来的 BERT 和 GPT 等预训练模型奠定了重要基础。

#人工智能

由ChatGPT 的记忆系统谈及如何构建一个对话应用智能体

这是最让我意外的部分，我本以为 ChatGPT 会对过往对话使用某种 RAG 技术，实则采用了轻量摘要的方式。1. <时间戳>：<聊天标题>|||| 用户消息片段 |||||||| 用户消息片段 ||||关键发现：仅总结用户消息，不包含助手回复；最多存储约 15 条摘要；仅作为用户近期兴趣的 “粗略地图”，而非详细上下文。ChatGPT 的方案更简洁：预先生成轻量摘要并直接注入，以牺牲部分细节为代

#人工智能

【数据集】全面了解 GLUE 数据集：自然语言理解的试金石

特性内容本质多任务自然语言理解评估平台数量共 9 个任务，涵盖分类、推理、匹配等目标测试模型的通用语言理解能力工具与 HuggingFace 集成，加载简便意义促进了 NLP 领域的统一评估和快速发展。

#人工智能 #机器学习

共 35 条

请选择