logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【Harness】智能体驾驭层介绍

智能体 Harness 可以理解为:把大模型包起来、让它能稳定完成任务的一整套运行框架。模型本身只是“会预测下一段文本”的核心能力;Harness 则负责把它变成一个可用的 Agent。举个代码助手的例子:LLM:负责理解需求、生成计划、写代码思路。Harness:负责读取仓库文件、调用编辑工具、运行测试、处理报错、遵守权限、把最终结果反馈给用户。没有 Harness,模型只能聊天;有了 Harn

#人工智能
【MySQL】死锁-Deadlock found when trying to get lock; try restarting transaction

1.场景:建表语句:CREATE TABLE `aaa` (`id` bigint(20) NOT NULL COMMENT '主键',`schs_id` bigint(20) NOT NULL COMMENT '',`sch_id` bigint(20) NOT NULL COMMENT '',`rsp_status` bit(1) NOT NULL DEFAULT b'1' COMMENT '

【NLP】RNN模型构建⼈名分类器

模型训练的损失降低快慢代表模型收敛程度, 由图可知, 传统RNN的模型收敛情况最 好, 然后是GRU, 最后是LSTM, 这是因为: 我们当前处理的⽂本数据是⼈名, 他们的⻓ 度有限, 且⻓距离字⺟间基本⽆特定关联, 因此⽆法发挥改进模型LSTM和GRU的⻓距 离捕捉语义关联的优势. 所以在以后的模型选⽤时, 要通过对任务的分析以及实验对 ⽐, 选择最适合的模型.LSTM. 构建GRU模型的类cl

#自然语言处理#rnn#深度学习
【OpenClaw】OpenClaw 在windows下的安装及飞书的接入

1.访问 Node.js 官网:https://nodejs.org/zh-cn/download。1.访问 Git 官网:https://git-scm.com/install/windows。启动成功后,会提示本地访问地址(默认 http://localhost:18789)。openclaw官网:https://docs.openclaw.ai/zh-CN。1.打开 OpenClaw 官网:

#人工智能
【OpenClaw】OpenClaw 在windows下的安装及飞书的接入

1.访问 Node.js 官网:https://nodejs.org/zh-cn/download。1.访问 Git 官网:https://git-scm.com/install/windows。启动成功后,会提示本地访问地址(默认 http://localhost:18789)。openclaw官网:https://docs.openclaw.ai/zh-CN。1.打开 OpenClaw 官网:

#人工智能
【大模型】Sora关键技术逆向工程图解 | 万字长文

Sora 生成的视频效果好吗?确实好。Sora 算得上 AGI 发展历程上的里程碑吗?我个人觉得算。我们知道它效果好就行了,有必要知道 Sora 到底是怎么做的吗?我觉得最好是每个人能有知情的选择权,任何想知道的人都能够知道,这种状态比较好。那我们知道 Sora 到底是怎么做出来的吗?不知道。马斯克讽刺 OpenAI 是 CloseAI,为示道不同,转头就把 Grok 开源了。且不论 Grok 效

#人工智能
【数据集】GLUE子任务-STS-B 数据集详解:衡量句子之间的语义相似度

STS-B 全称是 Semantic Textual Similarity Benchmark,是由 SemEval 比赛发展而来的标准句子对语义相似度数据集,用于评估模型理解两个句子语义接近程度的能力。属于 GLUE 基准任务之一。项目内容数据集名称任务类型语义相似度回归(0~5 分)标签含义相似度得分,越高越相近使用平台GLUE、HuggingFace、SQuAD等推荐模型BERT, SBER

#人工智能
【数据集】全面了解 GLUE 数据集:自然语言理解的试金石

特性内容本质多任务自然语言理解评估平台数量共 9 个任务,涵盖分类、推理、匹配等目标测试模型的通用语言理解能力工具与 HuggingFace 集成,加载简便意义促进了 NLP 领域的统一评估和快速发展。

#人工智能#机器学习
【Transformer】Transformer 中的解码器:文本生成的魔术师

模块作用防止看到未来 token对齐编码器的信息FFN增强每个 token 表达能力LayerNorm + 残差稳定训练,防止梯度消失堆叠结构逐层提升生成能力可以说,Transformer 的解码器层,就是大语言模型得以顺畅“说话”的秘密所在。如果没有它,我们今天就不会有 ChatGPT、Gemini 甚至是多模态 Sora 的流畅自然输出。

#transformer#深度学习#人工智能
【大模型】大模型基础知识

GPT是[Generative Pre-trained Transformer]的缩写,意为生成式预训练变换器.G 代表 Generative (生成式): 这是一种机器学习模型,其目标是学习数据的分布,并能生成与训练数据相似的新数据。在自然语言处理 (NLP)领域,生成式模型可以生成类似于人类所写的文本。GPT模型作为一个生成式模型,能够根据给定的上下文生成连贯的文本。

文章图片
    共 42 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择