logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

一文读懂大规模语言模型:概念、发展

大规模语言模型(Large Language Models,LLM),也叫大语言模型或大型语言模型是用包含数百亿以上参数的深度神经网络构建的语言模型。它通常采用自监督学习方法,通过大量无标注文本进行训练。2018 年以来,Google、OpenAI、Meta、百度、华为等公司和研究机构纷纷发布了 BERT、GPT 等多种模型。这些模型在几乎所有自然语言处理任务中都表现出色。2019 年大模型迎来爆

文章图片
#语言模型#人工智能#自然语言处理
探索大语言模型开源数据集

在大语言模型(LLM)的发展中,开源数据集起到了关键作用。本文介绍了四个具有代表性的开源数据集:Pile、ROOTS、RefinedWeb和SlimPajama。

文章图片
#语言模型#人工智能#自然语言处理
LLaMA模型结构与注意力机制优化

大语言模型(LLMs)如GPT系列和LLaMA的快速发展,推动了人工智能技术的革新。这些模型主要基于Transformer架构,通过自回归方式处理自然语言,展现出强大的能力。

文章图片
#语言模型#人工智能#自然语言处理
深入剖析大模型预训练数据:来源、处理与影响

大语言模型(LLM)的预训练数据是决定其性能的关键因素,尽管缺乏完善的理论分析,但数据对模型效果和泛化能力的影响被广泛认可。

文章图片
#语言模型
stable-diffusion-webui介绍与部署

魔塔社区算力平台部署stable-diffusion-webui

文章图片
厚德云算力使用步骤

AI大模型算力

人工智能专业技能及岗位解读

数据分析:Numpy、Pandas、Matplotlib、Seaborn、pyecharts、scipy、OpenCV。开源大模型:Llama、百川、千问、智谱、浦语、混元、ChatGPT、Ollama、Prompt。算力平台:魔塔社区、厚德云、丹摩、星海、驱动云、阿里云、腾讯云。AIGC方向:文本、图像、视频、音乐、数字人、智能体各种应用。

文章图片
#人工智能
Linux环境下部署Meta-Llama 3 AI大模型

步骤一:下载llama3-Chinese-chat模型。

文章图片
#linux#服务器#AIGC
    共 62 条
  • 1
  • 2
  • 3
  • 7
  • 请选择