logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大语言模型基础-与大语言模型交互

本文探讨了与大语言模型交互的核心技术,重点介绍了提示工程、文本分词和调用开源模型的方法。在提示工程部分,详细解析了模型采样参数(Temperature、Top-k、Top-p)、不同提示类型(零样本、单样本、少样本)以及指令调优的影响,并提供了角色扮演和思维链等实用技巧。文本分词部分阐述了子词分词算法的优势,深入讲解了BPE算法原理及其衍生技术。最后,以Qwen1.5-0.5B-Chat模型为例,

#语言模型#交互#人工智能
Flask 文件上传服务器 - 知识点总结

Flask/Werkzeug 提供的上传文件封装类,继承自 Python 的。Flask 内置服务器。

#flask#服务器#python
嵌入式开发入门——电子元器件~电容

标准单位:法拉(简称法)符号是F,用来表达单位电压下,电容器存储电荷的能力。1F的含义:在电容两端加1V电压,如果该电容器能够存储1库伦的电荷,那么该电容的溶质就是1F。

文章图片
#嵌入式硬件
大语言模型基础-与大语言模型交互

本文探讨了与大语言模型交互的核心技术,重点介绍了提示工程、文本分词和调用开源模型的方法。在提示工程部分,详细解析了模型采样参数(Temperature、Top-k、Top-p)、不同提示类型(零样本、单样本、少样本)以及指令调优的影响,并提供了角色扮演和思维链等实用技巧。文本分词部分阐述了子词分词算法的优势,深入讲解了BPE算法原理及其衍生技术。最后,以Qwen1.5-0.5B-Chat模型为例,

#语言模型#交互#人工智能
大语言模型基础-语言模型与 Transformer 架构

本文系统介绍了语言模型的发展历程,从早期的N-gram统计模型到神经网络语言模型,再到循环神经网络(RNN)和长短时记忆网络(LSTM)。重点解析了Transformer架构的核心组件:自注意力机制通过查询、键、值向量动态捕捉词元关系;多头注意力并行处理不同语义关联;前馈网络提取高阶特征;残差连接和层归一化确保训练稳定性;位置编码解决序列顺序问题。相比RNN的顺序处理瓶颈,Transformer实

文章图片
#语言模型#transformer#人工智能
AI Agent体入门:从概念到原理

简单来说,智能体是基于大语言模型的、能够自主理解、规划、决策并执行复杂任务的智能系统。传统大语言模型:就像一个“超级大脑”。能做什么:接收输入 → 分析推理 → 输出文字/代码/多媒体。局限性:它被“困”在文本世界里,无法主动规划,无法使用外部工具,也没有长期记忆,更像一个知识渊博但“手无寸铁”的顾问。人类:是“智能体”的理想形态。人类 =大脑记忆工具规划。AI智能体:试图让大模型拥有人类的部分能

#语言模型#人工智能
嵌入式开发入门——电子元器件~电阻

一般用于精度±0.1%的电阻,它是由两位数字加一位字母表示,前两位数字标识的阻值,要通过查表获得,最后一位字母表示倍数关系,也需要查表获得。一般用于精度为±1%的电阻,它的前三位是有效数字,第四位表示:在有效数字后面所加“0”的个数,字母R表示小数点。一般用于精度为±5%的电阻,前两位式有效数字,第三位表示:在有效数字后面所加“0”的格式,无引脚,无需打孔,体积小,重量轻,用于消费电子产品,高密度

文章图片
#嵌入式硬件
    共 21 条
  • 1
  • 2
  • 3
  • 请选择