logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

为什么对ChatGPT、ChatGLM这样的大语言模型说“你是某某领域专家”,它的回答会有效得多?(三)...

“ ChatGPT 的 Transformer 神经网络架构,以及海量的数据训练让它能够像人类一样进行写作。”经过前面两期漫长的介绍文章:为什么对ChatGPT、ChatGLM这样的大语言模型说“你是某某领域专家”,它的回答会有效得多?(一)为什么对ChatGPT、ChatGLM这样的大语言模型说“你是某某领域专家”,它的回答会有效得多?(二)这么硬核的技术科普内容,朋友们难得还能继续坚持阅读下来

#语言模型#人工智能#自然语言处理
REACT:在语言模型中协同推理与行动,使其能够解决各种语言推理和决策任务。...

“谷歌的研究人员提出了一种通用的方法,将推理(Reson)和行动(Acting)相结合,使得语言模型能够处理多种语言推理和决策任务。该研究表明,采用“推理+动作”范式(ReAct)要优于仅有推理或仅有动作的范式。通过紧密结合推理和动作,这种方法呈现出与人类类似的任务解决方式,从而提升了模型的可解释性、可诊断性和可控性。”01—上一篇《5分钟玩转PDF聊天机器人!超简单的Langchain+Cha.

#react.js#语言模型#前端 +2
如何避免ChatGPT,ChatGLM这类大语言模型胡说八道

“ChatGPT,ChatGLM这类大语言模型一本正经的胡说八道,可能也是它创造性回答的部分。那么谁来判断它在编造无中生有的内容?恐怕只有人才能判断。模型怎么会产生幻觉,我们又怎么避免它产生幻觉?”01—昨天体验了国产大模型:ChatGLM2-6B 初体验,可以看到在实战问题环节,询问高考报考志愿选择院校的建议,由于提问时问题中的错别字,导致模型在回答时,输出了一个编造的“北极邮电大学”的内容:.

#语言模型#人工智能#自然语言处理
大规模语言模型从理论到实践:模型基础、数据、强化学习、应用、评估

“推荐张奇、桂韬、郑锐、⻩萱菁合著的一本讲述大模型从理论到实践的书。关注公众号,可领取电子版。”全书目录1 绪论1.1 大规模语言模型基本概念1.2 大规模语言模型发展历程1.3 大规模语言模型构建流程1.4 本书的内容安排2 大语言模型基础2.1 Transformer 模型2.2 生成式预训练语言模型 GPT2.3 大语言模型结构3 ...

#语言模型#人工智能#自然语言处理
为什么对ChatGPT、ChatGLM这样的大语言模型说“你是某某领域专家”,它的回答会有效得多?(一)...

“太长不看总结版:LLM大模型的本质在于计算某个词汇后面应该跟着哪些词汇的概率。当问题给定了特定的限定范围后,它能够找到一条相对明确的计算路径,从一系列概率分布中挑选出所需的答案。否则,它会根据最常见且最高概率的组合方式生成回答内容。”01—缘起在前面文章中:被卖到 2w 的 ChatGPT 提示词 Prompt 你确定不想要吗?点燃创作灵感:Prompt 实践指南揭秘!让 ChatGPT 更智.

#语言模型#人工智能#自然语言处理
万字长文-大语言模型指令调优综述

写在前面大家好,我是刘聪NLP。大模型纵横的时代,不仅大模型越来越卷,就连大模型相关综述也是越来越卷。今天给大家带来一篇大语言模型指令调优最新综述,全名为《Instruction Tuning for Large Language Models: A Survey》,来自知乎@龟壳。Paper:https://arxiv.org/pdf/2308.10792.pdf知乎:https://zhu..

#语言模型#人工智能#深度学习 +1
AI搜索选哪个?18家AI搜索产品横向测评

引言距离《AI 搜索,一次讲透》文章发布已经快一个月了,AI 搜索赛道依然火热,各款产品都在努力优化,还有几款新产品推出。时间到了6月,非常好奇各款产品表现如何,今天就都拉过来测一测。刚把第一个Query测完,就发现了很多产品的严重问题,结合后续的几轮测试,已经足以得出一些值得参考的结论。受限于篇幅和时间,本文将完整记录第一轮的AI搜索测试,并结合后续几轮的测试,给出一些个人的体感结论。希望能帮助

#人工智能
AI人工智能大模型失守!ChatGPT、BARD、BING、Claude 相继被"提示攻击"攻陷!

“提示攻击,一种利用巧妙的技巧和迷惑性的指令,让这些顶尖的语言模型产生混乱或错误的回答的方法。”01—什么是提示攻击‍‍之前在文章:已证实:GPT不能提供有效的Windows11的密钥提到,有人曾利用让 ChatGPT 扮演他的奶奶讲睡前故事的方式,诱使大模型说出了微软的激活密钥。这也表明,在大模型出现后,一种新的安全问题出现了。提示词(Prompt)是指在训练或与大型语言模型(LLM,目前有..

#人工智能
ChatGLM推出第三代基座大模型在论文阅读、文档摘要和财报分析等方面提升超过50%推理成本降低一半...

“智谱AI发布了第三代基座大模型ChatGLM3,在模型性能、功能支持、开源序列等方面进行了全面升级。ChatGLM3在语义、数学、推理、代码、知识等不同角度的数据集上测评显示,具有在10B以下的基础模型中最强的性能。同时,ChatGLM3还支持多模态理解、代码增强、联网搜索等新功能,并可支持网络边缘端部署和高效推理。”01—就在今天,智谱AI在2023 中国计算机大会(CNCC)上,推出了全..

#论文阅读
大模型应用发展的方向|代理 Agent 的兴起及其未来(上)

“介绍了人工智能代理的历史渊源与演进,接着探讨了大型语言模型(LLMs)的发展,以及它们在知识获取、指令理解、泛化、规划和推理等方面所展现出的强大潜力。在此基础上,提出了一个以大型语言模型为核心的智能代理概念框架,该框架包括大脑、感知和行动这三个主要组成部分。”01—长期以来人工智能领域一直追求与人类水平相当甚至超越人类的人工智能(AI),AI 代理(Agent)被认为是实现这一追求的有希望的工.

    共 161 条
  • 1
  • 2
  • 3
  • 17
  • 请选择