
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
随着ChatGPT的火爆,越来越多人希望在本地运行一个大语言模型。为此我维护了这个开源大语言模型汇总,跟踪每天不发的大语言模型和精调语言模型。

本文从语义理解、内容创作、逻辑推理、编码能力、数学能力、人格模拟6个维度对文心一言和GPT-4进行了全面系统地横向比较。

万字长文,超详细一步一步教你在本地部署运行当下超火的Stable Diffusion模型,生成各种风格图像。

梯度下降是机器学习中最常见的优化算法之一。理解它的基本实现是理解所有基于它构建的高级优化算法的基础。本文详细为大家推导了 MSE 作为损失函数时的梯度下降公式。

祝大家 π Day快乐!

Llama 2是由领先的人工智能研究公司 Meta(前Facebook)开发并发布的下一代大型语言模型 (LLM)。旨在帮助开发人员和企业组织构建基于人工智能的生成工具和用户体验。本文将指导你完成在 Mac M1 上设置 `Llama 2` 的过程,并根据使用你自己的数据对其进行精调。

NLP 在金融技术领域的应用广泛且复杂,主要应用场景包括情感分析、命名实体识别到问答等。大语言模型 (LLM) 已被证明可以有效处理上述任务;但是,鲜少没有报道过有专门针对金融领域的文献。本作中,我们展示了 BloombergGPT 这个拥有 500 亿参数的语言模型,它采用大量金融数据训练而来。我们基于 Bloomberg 大量的数据源构建了一个 3630 亿个token数据集,这可能是迄今为止

双泊松模型有一个严重的缺陷,那就是它假设比赛中两队的比分是条件独立的。而我们都知道,在对抗性比赛中,两队的比分是存在关联的,双泊松模型可以描述比分的这种关联性,提高了比赛结果预测的准确度。

本文概述 AI 的发展历程,梳理出从早期神经网络模型到现代大型语言模型发展过程中的重要里程碑。

Microsoft 的工程师计划于 2024 年 11 月在 Azure 上部署 Orion (GPT-5)。虽然这一版本不会向公众开放,但其上线被视为人工智能领域的一个重要里程碑,并将产生深远的影响。
