logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

什么是transformer大模型,答案就在这里

Transformer大模型通过自注意力机制和编码器-解码器结构,能够高效地处理序列数据,并在自然语言处理等多个领域取得了显著的性能提升。其独特的架构和高效的并行计算能力使得Transformer成为当前自然语言处理领域的主流方法之一。

文章图片
#transformer#深度学习#人工智能
LangChain真的好用吗?谈一下LangChain封装FAISS的一些坑

最近在做一个知识库问答项目,就是现在大模型浪潮下比较火的 RAG 应用。LangChain 可以说是 RAG 最受欢迎的工具,因此我首选 LangChain 来快速构建我的应用。坦白来讲 LangChain 本身一套对于组件的定义已经让我感觉很复杂,为什么采用f-string或就能完成的事情必须要抽出一个这么复杂的对象。当然上面种种原因可能是我不理解 LangChain 设计之禅,但是下面这个坑确

文章图片
#faiss#学习#语言模型 +2
AI大模型加持的新一代网络舆情系统——“速途观澜”舆情感知引擎发布上线

*据悉,该系统以大数据+AI的双轮驱动为技术底座,是集舆情信息的实时监测、多层分析、智能研判、精准应对等核心功能于一体的网络舆情态势感知系统,**AI等前沿技术的引入为该产品注入了强大的动力,产品性能得到了大幅度的强化提升,进一步提升了其在行业内的竞争力和应用价值。再者,相较于传统舆情科技公司普遍存在强数据分析能力、弱舆情应对处理能力的弊端,

文章图片
#人工智能#语言模型
大模型深度解析:从入门到精通,一篇掌握所有要点

大模型是指具有数千万甚至数亿参数的深度学习模型。近年来,随着计算机技术和大数据的快速发展,深度学习在各个领域取得了显著的成果,如自然语言处理,图片生成,工业数字化等。为了提高模型的性能,研究者们不断尝试增加模型的参数数量,从而诞生了大模型这一概念。大模型通常由深度神经网络构建而成,拥有数十亿甚至数千亿个参数。大模型的设计目的是为了提高模型的表达能力和预测性能,能够处理更加复杂的任务和数据。大模型采

文章图片
#人工智能#学习
源码编译安装zabbix agent

最近公司使用了麒麟操作系统,需要安装Zabbix监控。官方提供的安装包中并没有针对麒麟系统的,需要进行编译安装。以下方法及其他linux也适用,包括统信UOS。

文章图片
#zabbix#linux#服务器 +2
2024年程序员必备:大模型入门书籍精选,畅销书单不容错过!

本书将以生动活泼的笔触,将枯燥的技术细节化作轻松幽默的故事和缤纷多彩的图画,引领读者穿梭于不同技术的时空,见证自然语言处理技术的传承、演进与蜕变。在这场不断攀登技术新峰的奇妙之旅中,读者不仅能深入理解自然语言处理技术的核心原理,还能自己动手,从零开始搭建起一个又一个语言模型。

文章图片
#人工智能
学大模型必看!手把手带你从零微调大模型!

微调大模型需要非常高的电脑配置,比如GPU环境,相当于你在已经预训练好的基础上再对大模型进行一次小的训练。但是不用担心,本篇文章会使用阿里魔塔社区提供的集成环境来进行,无需使用你自己的电脑配置环境。你只需要有浏览器就可以完成。本次微调的大模型是零一万物的 Yi 开源大语言模型,当然微调其他大模型的过程和原理也有差不多。这里说明一下,阿里魔塔社区对于新用户提供了几十小时的免费GPU资源进行使用,正好

#人工智能#深度学习#语言模型
一文读懂 Transformer 神经网络模型

在过去几年中,Transformer 模型已经成为高级深度学习和深度神经网络领域的热门话题。自从其在 2017 年被引入以来,Transformer 深度学习模型架构已经在几乎所有可能的领域中得到了广泛应用和演进。该模型不仅在自然语言处理任务中表现出色,还对于其他领域,尤其是时间序列预测方面,也具有巨大的帮助和潜力。那么,什么是 Transformer 神经网络模型?Transformer 模型是

文章图片
#transformer#神经网络#深度学习 +3
AI大模型新应用:阿里巴巴推出AgentScope多智能体开发平台

在多智能体应用开发的浪潮中,阿里巴巴通义实验室近日开源了一款创新的编程框架与开发平台——AgentScope。该平台专为多智能体应用开发者设计,旨在提供高易用的编程体验、稳定可靠的运行时保障,并为开发者提供分布式和多模态的技术支持。AgentScope内置了OpenAI、DashScope、Gemini、Ollama等多种不同平台的模型API,深度兼容当下的大模型开源生态。

文章图片
#人工智能#数据挖掘#开源 +3
大模型推理优化技术-KV Cache

KV Cache 是大模型推理性能优化的一个常用技术,该技术可以在不影响任何计算精度的前提下,通过空间换时间的思想,提高推理性能。本文简要分析了 KV Cache 原理、源码以及计算量和显存占用,这是一种典型的通过空间换时间(计算)的技术,虽然并不复杂,但是现在基本上是仅编码器Transformer架构生成大语言模型必备优化技术。

文章图片
#人工智能#产品经理#语言模型 +3
    共 25 条
  • 1
  • 2
  • 3
  • 请选择