logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

NLP自然语言处理实战(一):利用分词器构建词汇表

在NLP中,分词(tokenization,也称分词)是一种特殊的文档切分(segmentation)过程。而文档切分能够将文本拆分成更小的文本块或片段,其中含有更集中的信息内容。文档切分可以是将文档分成段落,将段落分成句子,将句子分成短语,或将短语分成词条(通常是词)和标点符号。

re正则表达式

正则表达式,python,re

#正则表达式#python
书生·浦语大模型实战营:1.书生·浦语大模型全链路开源体系

其中7B、20B都是开源的,免费商用的。从专用模型到通用大模型。

#人工智能
书生·浦语大模型实战营(第二期):OpenCompass司南大模型评测实战

上海人工智能实验室科学家团队正式发布了大模型开源开放评测体系 “司南” (OpenCompass2.0),用于为大语言模型、多模态模型等提供一站式评测服务。开源可复现:提供公平、公开、可复现的大模型评测方案全面的能力维度:五大维度设计,提供 70+ 个数据集约 40 万题的的模型评测方案,全面评估模型能力丰富的模型支持:已支持 20+ HuggingFace 及 API 模型分布式高效评测:一行命

#人工智能#学习
书生·浦语大模型实战营(第二期):Lagent&AgentLego智能体应用搭建

可以感知环境中的动态条件能采取动作影响环境能运用推理能力理解信息、解决问题、产生推断、决定动作。

#人工智能#语言模型#学习
书生·浦语大模型实战营(第二期):Lagent&AgentLego智能体应用搭建

可以感知环境中的动态条件能采取动作影响环境能运用推理能力理解信息、解决问题、产生推断、决定动作。

#人工智能#语言模型#学习
书生·浦语大模型实战营:1.书生·浦语大模型全链路开源体系

其中7B、20B都是开源的,免费商用的。从专用模型到通用大模型。

#人工智能
NLP自然语言处理实战(一):利用分词器构建词汇表

在NLP中,分词(tokenization,也称分词)是一种特殊的文档切分(segmentation)过程。而文档切分能够将文本拆分成更小的文本块或片段,其中含有更集中的信息内容。文档切分可以是将文档分成段落,将段落分成句子,将句子分成短语,或将短语分成词条(通常是词)和标点符号。

    共 14 条
  • 1
  • 2
  • 请选择