logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

一文读懂大语言模型 (LLM)是什么?

2023年,让整个人类最为振奋的AI技术就是ChatGPT。“大语言模型(Large Language Model)”这个词也随之映入人们的眼帘。ChatGPT让人觉得惊艳之处,能够结合上下文,像人一样有逻辑性地回答问题,就算生成超长的文本也不会跑偏。)是一种机器学习算法,它可以根据给定文本来预测下一个词语或字符的出现的概率,通过大量的文本数据来学习语言的统计特征,进而生成具有相似统计特征的新文本

文章图片
#语言模型#人工智能#AIGC +1
一文搞定 大语言模型(LLM)微调方法

众所周知,大语言模型(LLM)正在飞速发展,各行业都有了自己的大模型。其中,大模型微调技术在此过程中起到了非常关键的作用,它提升了模型的生成效率和适应性,使其能够在多样化的应用场景中发挥更大的价值。那么,今天这篇文章就带大家深入了解大模型微调。其中主要包括什么是大模型微调、什么时候需要大模型微调、大模型微调方法总结、大模型微调最佳实践等。在介绍大模型微调方法之前,首先带大家了解一下大语言模型的项目

文章图片
#语言模型#人工智能#深度学习 +3
图解AI三大核心技术:RAG、大模型、智能体

图解AI三大核心技术:RAG、大模型、智能体

文章图片
#人工智能#AI#RAG
大模型应用不同提示词范式和ReAct Agent智能体实现原理分析

大模型应用不同提示词范式和ReAct Agent智能体实现原理分析

文章图片
#人工智能
小白也能看懂 大模型的6个评估指标_大模型生成质量评估标准

近年来,随着深度学习技术的飞速发展,大型神经网络模型如BERT、GPT-3等已经成为自然语言处理、计算机视觉、语音识别等领域的重要工具。这些模型之所以称为"大型",是因为它们通常包含数十亿甚至数千亿的参数,比以往的模型要庞大得多。然而,模型的规模庞大并不总是意味着性能更好,因此我们需要一套有效的方法来评估这些大型神经网络的性能。本文将探讨为什么要评估大型神经网络模型,以及如何使用一系列关键指标来评

文章图片
#语言模型#人工智能#AI
[NLP]如何训练自己的大型语言模型

大型语言模型,如OpenAI的GPT-4或Google的PaLM,已经席卷了人工智能领域。然而,大多数公司目前没有能力训练这些模型,并且完全依赖于只有少数几家大型科技公司提供技术支持。在Replit,我们投入了大量资源来建立从头开始训练自己的大型语言模型所需的基础设施。在本文中,我们将概述我们如何训练LLM(Large LanguageModels),从原始数据到部署到用户面向生产环境。

文章图片
#自然语言处理#语言模型#人工智能 +2
想转行做大模型?AI产品经理们,先看看这份指南再考虑吧!

如果你想转行做大模型,作为一名AI产品经理,你可以怎么做呢?或许,你可以先进行自我检测,看看自己是否真的适合转行做大模型。这篇文章里,我给想转行做大模型的AI产品经理们提出了一些建议,不妨来看看吧。

文章图片
#人工智能#产品经理#AI
小白也能看懂 大模型的6个评估指标_大模型生成质量评估标准

近年来,随着深度学习技术的飞速发展,大型神经网络模型如BERT、GPT-3等已经成为自然语言处理、计算机视觉、语音识别等领域的重要工具。这些模型之所以称为"大型",是因为它们通常包含数十亿甚至数千亿的参数,比以往的模型要庞大得多。然而,模型的规模庞大并不总是意味着性能更好,因此我们需要一套有效的方法来评估这些大型神经网络的性能。本文将探讨为什么要评估大型神经网络模型,以及如何使用一系列关键指标来评

文章图片
#语言模型#人工智能#AI
deepseek本地部署硬件需求清单,太炸裂了!

如何学习AI大模型?这段时间,随着 DeepSeek 影响力的持续破圈,各大算力平台和第三方都在积极支持并上线 DeepSeek。那除此之外,很多小伙伴也在自己的机器上尝试了 DeepSeek 的本地部署。那关于本地部署,之前我们曾分享过一篇文章,是有关 DeepSeek-R1 在本地部署的教程。当时评论区包括私信就有不少小伙伴咨询了有关 DeepSeek-R1 不同版本在部署时所对应的电脑配置要

文章图片
#人工智能#算法#大数据
如何挑选适合AI大模型推理的显卡?

在人工智能领域,特别是模型训练和推理阶段,显卡性能极为关键。随着模型规模的增加,对算力的需求也在不断上升。因此,挑选合适的显卡,实现高性能与性价比的平衡,成为众多开发者关注的焦点。市面上的加速卡种类繁多,但谈到适合大模型推理的显卡,4090无疑是当前的佼佼者。尽管在性能上不及H100,在价格上不如3090,但4090凭借其出色的性价比和性能,成为大模型推理的首选。4090显卡基于Ada Lovel

文章图片
#人工智能#web安全#网络 +2
    共 101 条
  • 1
  • 2
  • 3
  • 11
  • 请选择