logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

开源大语言模型(LLM)汇总(持续更新中)

随着ChatGPT的火爆,越来越多人希望在本地运行一个大语言模型。为此我维护了这个开源大语言模型汇总,跟踪每天不发的大语言模型和精调语言模型。

文章图片
#语言模型#人工智能#深度学习
文心一言 vs GPT-4 —— 全面横向比较

本文从语义理解、内容创作、逻辑推理、编码能力、数学能力、人格模拟6个维度对文心一言和GPT-4进行了全面系统地横向比较。

文章图片
#人工智能
万字长文:Stable Diffusion 保姆级教程

万字长文,超详细一步一步教你在本地部署运行当下超火的Stable Diffusion模型,生成各种风格图像。

文章图片
#人工智能#计算机视觉#机器学习
【白话机器学习系列】白话梯度下降

梯度下降是机器学习中最常见的优化算法之一。理解它的基本实现是理解所有基于它构建的高级优化算法的基础。本文详细为大家推导了 MSE 作为损失函数时的梯度下降公式。

文章图片
#机器学习#人工智能#深度学习 +1
在 Mac M1 上运行 Llama 2 并进行训练

Llama 2是由领先的人工智能研究公司 Meta(前Facebook)开发并发布的下一代大型语言模型 (LLM)。旨在帮助开发人员和企业组织构建基于人工智能的生成工具和用户体验。本文将指导你完成在 Mac M1 上设置 `Llama 2` 的过程,并根据使用你自己的数据对其进行精调。

文章图片
#macos#生成式AI#机器学习 +1
BloombergGPT: 首个金融垂直领域大语言模型

NLP 在金融技术领域的应用广泛且复杂,主要应用场景包括情感分析、命名实体识别到问答等。大语言模型 (LLM) 已被证明可以有效处理上述任务;但是,鲜少没有报道过有专门针对金融领域的文献。本作中,我们展示了 BloombergGPT 这个拥有 500 亿参数的语言模型,它采用大量金融数据训练而来。我们基于 Bloomberg 大量的数据源构建了一个 3630 亿个token数据集,这可能是迄今为止

文章图片
#金融#语言模型#人工智能 +1
【12月17日更新决赛预测】用二元泊松模型预测2022年世界杯淘汰赛结果

双泊松模型有一个严重的缺陷,那就是它假设比赛中两队的比分是条件独立的。而我们都知道,在对抗性比赛中,两队的比分是存在关联的,双泊松模型可以描述比分的这种关联性,提高了比赛结果预测的准确度。

文章图片
#概率论#算法#python +1
AI 简史:从神经元到现代大模型

本文概述 AI 的发展历程,梳理出从早期神经网络模型到现代大型语言模型发展过程中的重要里程碑。

文章图片
#深度学习#人工智能#神经网络 +2
GPT-5 要来了:抢先了解其创新突破

Microsoft 的工程师计划于 2024 年 11 月在 Azure 上部署 Orion (GPT-5)。虽然这一版本不会向公众开放,但其上线被视为人工智能领域的一个重要里程碑,并将产生深远的影响。

文章图片
#生成式AI
    共 94 条
  • 1
  • 2
  • 3
  • 10
  • 请选择