logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

自然语言处理的进化

关于不同的语言模型如何选择,我们有了大模型,以前的这些语言模型还有用吗?我们的目标是制造一个为人们服务的产品,机器学习和人工智能只是达到目的的手段。重要的是很好的解决问题,而不是使用哪种方法。在大多数情况下,快速而不完美、不规范、不“高大上”的解决方案反而会让我们快速步入正轨。当简单的匹配就可以解决问题的时候,是不需要训练深度神经网络的。其实今天的快速而不完美,正是建立在昨天的缓慢和精确上的。如今

#语言模型#nlp
将大型语言模型(如GPT-4)微调用于文本续写任务

要将大型语言模型(如GPT-4)微调用于文本续写任务,构造高质量的训练数据至关重要。通过以上步骤,您可以构造用于文本续写任务的高质量训练数据,为大型语言模型的微调打下坚实基础。

#语言模型#人工智能#自然语言处理
大语言模型训练的目标(不同的结构和阶段)

大语言模型(Large Language Models, LLMs)的训练目标是其能力的核心来源,决定了模型如何从海量数据中学习语言规律和知识。以下是其训练目标的分类和详细说明:预训练是LLMs的基础阶段,通过无监督或自监督任务学习通用语言表示。常见目标包括:在预训练后,模型通过特定任务的数据进一步优化:从单一目标到统一框架从语言建模到多模态学习从静态训练到动态反馈大语言模型的训练目标设计是其能力

#语言模型#人工智能#自然语言处理
让大模型成为你的得力助手(3)-OpenAI API

Chat API:多轮对话,但可以用对话逻辑完成任何任务,包括续写文本。Completion API:续写文本,多用于补全场景。其它大模型的 API 基本都是参考 OpenAI,只有细节上稍有不同。有的大模型只提供 Chat。

#nlp
linux 安装open webui

(Ubuntu、Debian、CentOS 等)上安装。如果遇到问题,可以告诉我具体的错误信息,我帮你解决!如果你想用 Open WebUI 调用。容器正在运行,表示安装成功。并指定一个可用的模型,例如。

#linux#运维
自然语言处理面经

给你两个单词 word1 和 word2,请你计算出将 word1 转换成 word2 所使用的最少操作数。1.设计一个情感分析的流程,不使用正负极词典,可以提取哪些特征?gbdt中的决策树可以用其他的算法来代替吗,比如逻辑回归或者线性回归?(数据、模型、dropout、l1 l2正则),详细说一下L1\L2正则及其区别?给出n个新闻事件,如何从这n个事件中找到和当前事件最相似的,设计你的算法?你

#自然语言处理
大模型运行可视化工具

https://bbycroft.net/llm大模型预训练任务

#人工智能
常见的自然语言处理任务

情感分析(sentiment-analysis):对给定的文本分析其情感极性文本生成(text-generation):根据给定的文本进行生成命名实体识别(ner):标记句子中的实体阅读理解(question-answering):给定上下文与问题,从上下文中抽取答案掩码填充(fill-mask):填充给定文本中的掩码词文本摘要(summarization):生成一段长文本的摘要机器翻译(tran

#自然语言处理#人工智能
自然语言处理面经

给你两个单词 word1 和 word2,请你计算出将 word1 转换成 word2 所使用的最少操作数。1.设计一个情感分析的流程,不使用正负极词典,可以提取哪些特征?gbdt中的决策树可以用其他的算法来代替吗,比如逻辑回归或者线性回归?(数据、模型、dropout、l1 l2正则),详细说一下L1\L2正则及其区别?给出n个新闻事件,如何从这n个事件中找到和当前事件最相似的,设计你的算法?你

#自然语言处理
adam优化器计算过程(tensorflow)

原理应用优点缺点一步一步计算api使用。

#深度学习
    共 33 条
  • 1
  • 2
  • 3
  • 4
  • 请选择