JarodYv 个人主页

@JarodYv

JarodYv

2022-11-25 11:03:06 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

Stable Diffusion原理详解

本文向大家介绍了图像生成领域最前沿的Stable Diffusion模型。本质上Stable Diffusion属于潜在扩散模型(Latent Diffusion Model)。潜在扩散模型在生成细节丰富的不同背景的高分辨率图像方面非常稳健，同时还保留了图像的语义结构。因此，潜在扩散模型是图像生成即深度学习领域的一项重大进步。

#人工智能 #机器学习

OpenAI最新博文：人工智能系统的行为塑造与决策权归属

2月16日，OpenAI 博客发布最新文章"How should AI systems behave, and who should decide?"。文中OpenAI首次澄清了ChatGPT的行为是如何塑造的，以及进一步的改进计划。并且宣布未来会允许更多的用户定制，并在更多领域的决策中获得更多的公众投入。本文是对这篇博客的翻译，希望大家喜欢。

#人工智能 #ChatGPT

BloombergGPT: 首个金融垂直领域大语言模型

NLP 在金融技术领域的应用广泛且复杂，主要应用场景包括情感分析、命名实体识别到问答等。大语言模型 (LLM) 已被证明可以有效处理上述任务；但是，鲜少没有报道过有专门针对金融领域的文献。本作中，我们展示了 BloombergGPT 这个拥有 500 亿参数的语言模型，它采用大量金融数据训练而来。我们基于 Bloomberg 大量的数据源构建了一个 3630 亿个token数据集，这可能是迄今为止

#金融 #语言模型 #人工智能 +1

Lamini：大语言模型精调框架

Lamini 致力于解决 LLM 驱动开发中最困难的挑战之一。该框架提供了一个简单且一致的编程模型来抽象跨不同 LLM 的微调过程。我们很可能会在不久的将来看到 Lamini 被纳入不同的 LLM 框架。

#语言模型 #人工智能 #深度学习

图解NLP模型发展：从RNN到Transformer

本文以NLP模型发展为脉络，详细地解释了RNN、LSTM、GRU、seq2seq、注意力机制和Transformer。每一个技术都给出了清晰的图形化解释，便于大家理解。其中重点解释了Transformer的各个部分，因为Transformer 作为一个重要的里程碑，影响并创建了许多先进的 NLP 模型，如 GPT-3、BERT 等。