logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

利用GPT-3 Fine-tunes训练专属语言模型

ChatGPT强大的自然语言理解力和表达力,目前只表现在通用领域。一旦进入专业领域,ChatGPT经常“一本正经,胡说八道”。此时用特定领域的知识对模型进行微调是时间成本和经济成本最高的解决方案。

文章图片
#gpt-3#人工智能#nlp +1
Lamini:大语言模型精调框架

Lamini 致力于解决 LLM 驱动开发中最困难的挑战之一。该框架提供了一个简单且一致的编程模型来抽象跨不同 LLM 的微调过程。我们很可能会在不久的将来看到 Lamini 被纳入不同的 LLM 框架。

文章图片
#语言模型#人工智能#深度学习
陶哲轩如何用 GPT-4 辅助数学研究

快快围观加州理工数学系教授、菲尔茨奖得主陶哲轩如何用 GPT-4 辅助数学研究。

文章图片
#人工智能
开源大语言模型(LLM)汇总(持续更新中)

随着ChatGPT的火爆,越来越多人希望在本地运行一个大语言模型。为此我维护了这个开源大语言模型汇总,跟踪每天不发的大语言模型和精调语言模型。

文章图片
#语言模型#人工智能#深度学习
文心一言 vs GPT-4 —— 全面横向比较

本文从语义理解、内容创作、逻辑推理、编码能力、数学能力、人格模拟6个维度对文心一言和GPT-4进行了全面系统地横向比较。

文章图片
#人工智能
万字长文:Stable Diffusion 保姆级教程

万字长文,超详细一步一步教你在本地部署运行当下超火的Stable Diffusion模型,生成各种风格图像。

文章图片
#人工智能#计算机视觉#机器学习
【白话机器学习系列】白话梯度下降

梯度下降是机器学习中最常见的优化算法之一。理解它的基本实现是理解所有基于它构建的高级优化算法的基础。本文详细为大家推导了 MSE 作为损失函数时的梯度下降公式。

文章图片
#机器学习#人工智能#深度学习 +1
在 Mac M1 上运行 Llama 2 并进行训练

Llama 2是由领先的人工智能研究公司 Meta(前Facebook)开发并发布的下一代大型语言模型 (LLM)。旨在帮助开发人员和企业组织构建基于人工智能的生成工具和用户体验。本文将指导你完成在 Mac M1 上设置 `Llama 2` 的过程,并根据使用你自己的数据对其进行精调。

文章图片
#macos#生成式AI#机器学习 +1
BloombergGPT: 首个金融垂直领域大语言模型

NLP 在金融技术领域的应用广泛且复杂,主要应用场景包括情感分析、命名实体识别到问答等。大语言模型 (LLM) 已被证明可以有效处理上述任务;但是,鲜少没有报道过有专门针对金融领域的文献。本作中,我们展示了 BloombergGPT 这个拥有 500 亿参数的语言模型,它采用大量金融数据训练而来。我们基于 Bloomberg 大量的数据源构建了一个 3630 亿个token数据集,这可能是迄今为止

文章图片
#金融#语言模型#人工智能 +1
    共 96 条
  • 1
  • 2
  • 3
  • 10
  • 请选择