社区云

nlp

孟南知来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 3小时前

DeepSeek-V3.2-Speciale大战Gemini3Pro！你没见过的Prompt！

《Gemini 3 Pro vs DeepSeek V3.2-Speciale终极对决：谁才是真正的H5肉鸽游戏生成王者？》一次提示词，两款顶级AI模型交出截然不同的答卷。Gemini流畅体验惊艳全场，DeepSeek另辟蹊径挑战极限。点击看两大模型如何用代码诠释“肉鸽游戏”，结果超乎想象！

#人工智能 #nlp

421 

4 
JUyao_H 来自昇腾开源生态专区

ascendai.csdn.net · 14小时前

PyTorch 核心数据结构：Tensor 详解与操作指南

本文系统介绍了 PyTorch 核心数据结构 Tensor。内容涵盖 Tensor 的创建、属性查看、索引切片及形状变换（如 reshape）等基础操作。重点详解了各类数学运算（逐元素、线性代数）、广播机制规则，以及与 NumPy 的互换和 CPU/GPU 设备移动方法。该文档旨在为 PyTorch 开发者提供详尽的语法参考和操作指南。

#pytorch #数据结构 #人工智能 +4

538 

13 
HL18994121892 来自 2048 AI社区

2048ai.net · 21小时前

零代码搭 AI 团队！云蝠 2.0 40 语通杀成本砍半

从「数字员工」到「智能组织」，ToB AI 交互进入新时代

#人工智能 #语音识别 #自然语言处理 +3

429 

13 
FlowyAIPC 来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 2025-11-28 17:31:35

FlowyAIPC 发布全新 4.0：开启端侧 AI 的主动生产力时代

【2025年11月28日】 —— 端侧 AI 生产力工具正式发布全新版本。本次更新围绕三个方向进行了深度演进，进一步推动 AI 从工具型能力向真正的智能操作系统层能力迈进。FlowyAIPC 4.0 聚焦于让一台普通电脑成为可主动协助用户处理任务的，支持本地大模型推理、桌面级智能交互、会议全流程自动化、个人资料深度理解等功能，且完全可离线运行，适用于企业、开发者和个人用户等多场景。

#人工智能 #AIGC #语言模型 +2

487 

11 
DDDDWJDDDD 来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 1天前

基于昇腾平台的Qwen大模型推理部署实战：从模型转换到推理（含代码）

本文详细介绍了在GitCode昇腾云服务器上部署vLLM推理服务的完整流程。从环境准备开始，包括NPU可用性验证和基础算子测试；到模型转换阶段，将Qwen-1.8B模型从PyTorch转换为ONNX格式，再通过ATC工具编译为昇腾专用的OM格式；最后展示如何使用ACL接口在NPU上执行推理。关键步骤包含：1) 昇腾环境配置与验证；2) 模型格式转换中的问题排查与优化；3) 完整的ACL推理流程实

#昇腾 #nlp #语言模型 +2

2098 

20 
chillstep lover 来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 1天前

微调bge嵌入模型（一）构建问答对

在大模型落地企业服务的浪潮中，知识库问答（RAG）已成为最核心的应用场景之一 —— 无论是内部文档检索、客户服务智能应答，还是垂直领域知识查询，都离不开 “文本嵌入→向量检索→上下文生成” 的核心链路。而嵌入模型作为整个链路的 “地基”，其性能直接决定了检索精度与最终回答质量。BGE（BAAI General Embedding）作为中文场景下表现突出的开源嵌入模型，凭借优异的通用性和易用性，成为

#python #深度学习 #nlp

792 

16 
名为沙丁鱼的猫446 来自九章云极普惠算力

datacanvas.csdn.net · 2025-08-28 18:51:46

【超详细prompt解读】提示词优化指令设计指导语言模型完成任务与应用场景如文本摘要、信息提取、多轮问答、编写原则：使用分隔符、结构化输出、少样本提示等、APE和APE和BROKE两大提示工程框架

本文系统介绍了提示词工程（Prompt Engineering）的概念、应用场景及编写原则。主要内容包括：1）提示词工程的定义和作用，即通过优化指令设计指导语言模型完成任务；2）常见应用场景如文本摘要、信息提取、多轮问答等NLP任务；3）编写原则包括使用分隔符、结构化输出、少样本提示等技巧；4）介绍了APE和BROKE两大提示工程框架；5）讲解了问答系统中Prompt模板的使用方法。文章通过具体代

#自然语言处理 #nlp #人工智能 +3

1250 

28 
约定写代码来自九章云极普惠算力

datacanvas.csdn.net · 2021-03-30 18:22:48

nlp中的经典深度学习模型(一)

文章目录1 DNN与词向量1.1 DNN1.2 skip-gram1.3 简单句子分类模型DAN2 RNN+LSTM+GRU2.1 RNN2.2 LSTM1 DNN与词向量1.1 DNN神经网络中每一个神经单元是一个线性变化加一个激活函数s=UTas=U^Tas=UTaa=f(z)a=f(z)a=f(z)z=Wx+bz=Wx+bz=Wx+b多层神经网络就是不断向前加。1.2 skip-gram通过

#nlp

1101 

1 
ObsessionLife 来自九章云极普惠算力

datacanvas.csdn.net · 2018-03-17 20:27:53

[机器学习与深度学习] - No.1 基于Negative Sampling SKip-Gram Word2vec模型学习总结

基于Negative Sampling SKip-Gram Word2vec模型学习总结1. Word2vec简介Word2Vec是从大量文本语料中以无监督的方式学习语义知识的一种模型，它被大量地用在自然语言处理（NLP）中。那么它是如何帮助我们做自然语言处理呢？Word2Vec其实就是通过学习文本来用词向量的方式表征词的语义信息。Word2vec的结果是为了获得Word Embedd...

#自然语言处理 #nlp #机器学习

3883 

1 
超人汪小建(seaboat) 来自九章云极普惠算力

datacanvas.csdn.net · 2018-07-12 08:39:05

我的开源项目汇总(机器&深度学习、NLP、网络IO、AIML、mysql协议、chatbot)

TextAnalyzerhttps://github.com/sea-boat/TextAnalyzerA text analyzer which is based on machine learning,statistics and dictionaries that can analyze text.So far, it supports hot word extracting, ...

#开源 #机器学习 #nlp +1

3418 

8 
coco_12345 来自九章云极普惠算力

datacanvas.csdn.net · 2020-04-18 21:27:09

深度学习之NLP（一）

目录一.NLP的定义和歧义性二.词向量三.word2vec1.模型2.CBOW与Skip-Gram模式四.注意力机制attention transformerbert一.NLP的定义和歧义性NLP = NLU +NLGNLU:语音/文本—>意思meaningNLP : 意思meaning---->语音/文本Why NLP is harder than CV...

#机器学习 #nlp #人工智能 +2

1194 

1 
Power2024666 来自九章云极普惠算力

datacanvas.csdn.net · 2024-11-21 23:41:00

NLP论文速读（MPO）|通过混合偏好优化提高多模态大型语言模型的推理能力

在MathVista（多模态数学推理）基准测试中，InternVL2-8B-MPO的准确率达到了67.0%，比InternVL2-8B的58.3%高出8.7个百分点，并且与比InternVL2-8B大10倍的InternVL2-76B的性能相当。根据Table 2，论文的实验部分主要评估了作者提出的InternVL2-8B-MPO模型在多个多模态基准测试中的表现，并与其他领先的多模态大型语言模型（

#自然语言处理 #语言模型 #人工智能 +3

2002 

20 
Shush1337s 来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 2025-12-01 09:05:12

DeepSenti v2 情感分析大模型

DeepSentiv2情感分析引擎升级，支持中英文双语分析，采用跨语言迁移学习技术，准确识别混合文本中的情感表达。提供通用、电商、学术三个领域微调模型，通过对比学习和注意力机制提升对复杂表达的识别能力。新增情感关键词提取功能，定位影响情感判断的核心词汇，增强结果可解释性。优化后的推理速度提升3倍，支持秒级响应和大规模实时处理。输出包含结构化数据和可视化图表，适用于舆情监测、电商评论分析、学术研究等

#nlp

828 

9 
AggressiveYu 来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 2025-11-28 13:39:05

从零开始构建大模型第三步：损失函数优化器余弦退火调度器

需要手写训练所需的组件，而不是直接调用库函数：Cross-Entropy Loss: 手写交叉熵损失函数，注意处理 LogSumExp 的数值稳定性。AdamW 优化器: 手写 AdamW 优化算法，包括动量更新和权重衰减逻辑。学习率调度:实现 Cosine Annealing（余弦退火）学习率调度器，带 Warmup 阶段。Checkpointing:实现模型和优化器状态的保存与加载。Da

#人工智能 #pytorch #机器学习 +4

799 

14 
AggressiveYu 来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 2025-11-28 13:38:16

从零开始构建大模型第二步：优化版transformer架构搭建

这一章节会非常长，我们不仅要会写代码，还要把所有知识点吃透，不满足简单的定理，以及我会问一些及其深刻的问题，作为一个小点收尾，我敢打包票的事，你用一周或者两周时间吃透这篇博客，你的能力会有质的飞跃。

#transformer #深度学习 #人工智能 +4

970 

21 
kingnight233 来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 2025-11-27 17:01:00

知识蒸馏：模型压缩与性能提升的利器

知识蒸馏是一种将大模型知识迁移到小模型的技术，通过让学生模型学习教师模型的预测概率分布（软目标）来提升性能。该方法广泛应用于模型压缩、移动设备和NLP任务，能提高泛化能力并加速推理。核心流程包括训练教师模型、生成软目标和训练学生模型，损失函数结合软硬目标。扩展方法包括温度调节、多教师蒸馏和中间层蒸馏。PyTorch示例展示了蒸馏实现，而ViLD模型则结合视觉和语言知识进行蒸馏，提升跨模态任务性能。

#人工智能 #论文阅读 #python +2

912 

22 
网易易盾来自网易易盾开发者社区

yidun.csdn.net · 2021-01-26 19:29:40

知物由学 | 更适合文本分类的轻量级预训练模型

自 BERT 起，预训练语言模型沿着海量训练数据和庞大网络结构的方向在不断发展着。在12月落幕的 NeurIPS 2020 会议上，语言模型 GPT-3 荣膺最佳论文奖。OpenAI 的研究人员使用了多达 45TB 的文本数据来训练它的 1750 亿个参数。GPT-3 不仅仅是“变得更大”，它用“Few-Shot”学习替代了 FineTune，能够出色完成代码生成、领域问答、吉他谱曲等高难度的复合

#nlp #机器学习 #人工智能 +1

8987 
鹰立如睡来自昇腾开源生态专区

ascendai.csdn.net · 2020-09-24 20:03:48

cannot import name ‘glue_compute_metrics‘

环境：python 3.7torch 1.1.0transformers 3.1总是报导入错误。解决办法：装transformers之前没有装sklearnpip uninstall transformerspip install sklearnpip install transformers这样安装的transformers是3.2版本的。就可以了。...

#nlp #transformer

918 
炼丹笔记来自昇腾开源生态专区

ascendai.csdn.net · 2021-03-20 16:52:10

ALL in BERT：一套操作冲进排行榜首页

好久不打比赛，周末看到“全球人工智能技术创新大赛”已经开打了一段时间，前排分数冲的有点凶，技痒的我看到了一道熟悉的赛题——小布助手对话短文本语义匹配，由于在搜索推荐系统的一些任重中，文本语义匹配子任务也是经常会遇到的一个问题，于是乎掏出那根...咳咳..沉睡了很久的GPU，翻出了祖传代码，跑了一波Baseline...赛题题型不新鲜，在Baseline的的基础上参考了一些思路做些炼丹技巧上的操作，

#神经网络 #人工智能 #机器学习 +2

302 

1 
HL18994121892 来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 2025-11-25 15:35:01

大模型外呼技术在政务服务场景的具体应用案例，传统政务服务效率低？大模型外呼如何破局？

外呼技术是指通过自动拨打电话的方式，与客户进行语音交互的一种技术手段。其核心原理是利用通信技术和人工智能技术，实现自动拨号、语音识别、自然语言处理等功能。系统会根据预设的规则和策略，自动拨打目标电话号码，并通过语音识别技术将客户的语音转化为文字，然后利用自然语言处理技术理解客户的意图，生成相应的回复，并通过语音合成技术将文字转化为语音输出，实现与客户的智能对话。

#政务 #人工智能 #大数据 +3

750 

24 
新缸中之脑来自 DAMO开发者矩阵

damodev.csdn.net · 2017-12-06 11:45:45

聊天机器人（Chatbot）开发：自然语言处理（NLP）技术栈

我相信在大多数情况下，聊天机器人的开发者构建自己的自然语言解析器，而不是使用第三方云端API，是有意义的选择。这样做有很好的战略性和技术性方面的依据，我将向你展示自己实现NLP有多么简单。这篇文章包含3个部分：为什么要自己做最简单的实现也很有效你可以真正用起来的东西那么要实现一个典型的机器人，你需要什么样的NLP技术栈？

#自然语言处理 #nlp

6879 

1 
过往入尘土来自 DAMO开发者矩阵

damodev.csdn.net · 2025-09-08 20:24:28

NLP自然语言处理：开启人机交互新时代

引言在当今数字化时代，自然语言处理（Natural Language Processing，简称 NLP）作为人工智能领域的关键分支，正以前所未有的速度改变着我们与计算机交互的方式，深刻融入生活的各个角落。从智能手机中的语音助手到电商平台的智能客服，从内容创作领域的智能写作辅助到金融行业的风险评估，NLP 技术无处不在，展现出强大的应用潜力与价值。想象一下，当你忙碌于家务时，只需对着智能音箱说

#深度学习 #自然语言处理 #nlp

1315 

21 
qq_36671160 来自 DAMO开发者矩阵

damodev.csdn.net · 2025-05-05 22:36:13

提示词压缩方法总结与开源工具包

对各类提示词压缩方法的总结

#深度学习 #人工智能 #机器学习 +2

1156 

17 
LINJOSHUA 来自 DAMO开发者矩阵

damodev.csdn.net · 2025-08-06 15:24:07

文本相似度计算方法全视角解析

方法类别代表方法优点缺点适用场景One-Hot方法One-Hot + 余弦/欧式简单直观，实现容易忽略词序，无法处理OOV词小规模数据集，快速原型开发传统机器学习计算简单，可解释性强忽略词序，语义理解弱短文本，计算资源有限深度学习Word2Vec平均, USE捕捉语义信息需要大量数据训练通用语义相似度NLP专用编辑距离, Tree Kernels考虑结构信息计算复杂，领域特定特定领域如代码相似度L

#人工智能 #nlp #深度学习 +1

980 

30 
Strategic_3610256651 来自 DAMO开发者矩阵

damodev.csdn.net · 2025-10-31 17:31:42

舆情，情感微博系统demo，基于python+qt+nlp,开发语言python,界面库qt，无数据库版，数据来自第三方网站获取，

帮助客户修改桌面开发微博舆情情感分析Demo时，咱们用Python当主力，Qt当界面，虽然不是很熟悉QT但是咱们可以试着根据界面中的控件找到对应的控件事件锁定咱们需要修改，添加内容地方就行！数据直接爬第三方网站，没搞数据库省了不少事，但得注意爬取频率，不然容易被限制。核心是NLP做情感判定，直接调用对应库就行。跑通全流程时特开心，看着屏幕上蹦出的正负情感标签，感觉之前踩的坑都值了！

#开发语言 #qt #自然语言处理 +2

197 

1 
xddwz 来自 DAMO开发者矩阵

damodev.csdn.net · 2020-10-28 19:08:28

百度开源NLP工具LAC

工具介绍LAC全称Lexical Analysis of Chinese，是百度自然语言处理部研发的一款联合的词法分析工具，实现中文分词、词性标注、专名识别等功能。该工具具有以下特点与优势：效果好：通过深度学习模型联合学习分词、词性标注、专名识别任务，整体效果F1值超过0.91，词性标注F1值超过0.94，专名识别F1值超过0.85，效果业内领先。效率高：精简模型参数，结合Paddle预测库的性能

#nlp

1107 
青春之我_XP 来自 DAMO开发者矩阵

damodev.csdn.net · 2024-06-27 16:17:04

【知识图谱系列】Neo4j数据库操作全攻略：增删改查与快速清空技巧

本文将全面介绍Neo4j图数据库的基本操作，包括如何增加节点和关系、如何删除节点和关系、如何修改节点和关系的属性以及标签，以及如何进行查找操作。此外，还将分享一个实用的小技巧——如何快速清空Neo4j数据库中的所有数据。

#数据库 #neo4j #nlp +3

7775 

29 
LLLRRR1990 来自 DAMO开发者矩阵

damodev.csdn.net · 2019-06-24 14:49:25

医疗文本数据集-nlp

1. CCHMC数据来自辛辛那提儿童医院医学中心放射科(Cincinnati Children s Hospital Medical Center’s Department of Radiology，CCHMC)。CCHMC的机构审查委员会批准了数据的发布。采用bootstrap方法对所有门诊x线胸片和再胸片进行为期一年的采样(Walters, 2004)。这些数据是最常用的数据之一，它...

#自然语言处理 #nlp

6624 

2 
sqqqqqqy 来自魔乐社区

modelers.csdn.net · 2025-06-13 18:00:35

项目实训纪实（九）——前端AI对话界面的实现

本篇将系统性介绍我们在项目中实现的前端 AI 聊天界面，基于 Vue3 组合式 API 和 TypeScript 构建，结合 Axios 请求后端接口，实现了多轮对话、会话管理、消息渲染、Markdown 支持等完整功能。所展示的这份前端页面文件不仅仅是一个普通的“对话框”，更是前后端联动、响应式设计、用户体验优化等多个方面的集中体现。

#人工智能 #nlp #DeepSeek +1

1480 

2 
huangecho 来自魔乐社区

modelers.csdn.net · 2024-01-06 13:04:07

完整的虚假新闻检测数据集weibo_datasets

这是一个示例数据集。推文被分为训练集和测试集。对于每个集合，分别有两个文件存储谣言和非谣言的推文。该数据集的正负样本数量相当，差不多3700+。真正的数据集就是tweets文件。line2: 推文的图片。以下面这种形式组织“图片1 URL|图片2 URL|null”其中URL是图片的链接，null表示图片列表的结尾。

#nlp #数据仓库 #自然语言处理

5206 

22 
Du5Ty 来自 2048 AI社区

2048ai.net · 2025-11-23 23:03:32

OpenManus详解之 LLM.py

特别是在与 LLM（大语言模型）交互的时候，经常会遇到临时性的网络波动、超时、服务器繁忙等问题，这时候自动重试可以显著提升稳定性。把各种乱七八糟的消息格式（字典、对象、带图片的、不带图片的），统一整理成 OpenAI 接口能听懂的标准格式。调用一个可能会失败的方法（比如访问远程 API）时，这个装饰器会在出错后自动尝试重新执行，而不是立刻报错退出。如果没有单例机制，这两个 llm_a 和 llm_

#python #vscode #nlp +2

570 

25 
pk3725069 来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 2025-11-23 21:54:43

大模型基础 | 大模型集成方法

摘要本文探讨了大模型集成方法，重点介绍了三种主流技术：输出集成、概率集成和混合专家模型(MoE)。输出集成通过跨模型交流提升推理能力；概率集成对模型预测的logits结果进行平均处理；MoE则采用专家细粒度化和共享专家机制，在保持计算效率的同时提升模型性能。特别介绍了DeepSeekMoE的创新架构，包括专家细粒度化和共享专家设计，通过精细化的专家组合和通用/特定特征分离，显著提升了模型的泛化能

#transformer #深度学习 #人工智能 +4

417 

6 

标签介绍

nlp

——nlp

关于我们

联系我们（工作时间：8:30-22:00）

400-660-0108 kefu@csdn.net