xidianjiapei001 个人主页

@xidianjiapei001

xidianjiapei001

2023-04-04 10:31:31 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

DeepSeek-R1 论文解读 —— 强化学习大语言模型新时代来临？

近年来，人工智能（AI）领域发展迅猛，大语言模型（LLMs）为通用人工智能（AGI）的发展开辟了道路。OpenAI 的 o1 模型表现非凡，它引入的创新性推理时缩放技术显著提升了推理能力，不过该模型是闭源的。今天，我们深入探讨由 DeepSeek 发布的突破性研究论文，该论文介绍了 DeepSeek-R1。这篇题为《DeepSeek-R1：通过强化学习激发大语言模型的推理能力》的论文，展示了一种前

#语言模型 #搜索引擎 #人工智能

深度学习五大模型全解析：CNN、Transformer、BERT、RNN、GAN 的区别与联系，一文读懂！

深度学习中有许多重要的模型架构，以下是五种最具代表性的模型：CNN（卷积神经网络）、Transformer、BERT、RNN（循环神经网络）和GAN（生成对抗网络）。它们在不同的任务中表现出色，各自有独特的原理、应用场景和研究背景。下面将详细解释它们的区别与联系，并给出相关论文和参考代码。

#深度学习 #cnn #transformer

2025年助力拿下高薪工作的十大人工智能认证

想象一下：你一直在浏览招聘网站，梦想着获得一份年薪六位数的人工智能专家职位。但现实却很残酷——竞争激烈，雇主们在寻找既有又有的候选人。那么，你该如何脱颖而出呢？人工智能认证就是你的秘密武器。它们提供专业培训，帮助你掌握实用技能，并向雇主证明你的专业能力。无论你是刚刚起步，还是希望提升自己，这些认证都能赋予你竞争优势，助你获得理想工作。以下是2025年你应该考虑的十大人工智能认证，它们能为你开启人工

#人工智能

2025 机器学习面试就考这些！63 个问题带你冲刺 Offer

2025 机器学习面试就考这些！63 个问题带你冲刺 Offer要通过机器学习面试并非易事，因为它既要求具备深厚的技术知识，又注重实际应用。此外，由于互联网上可靠的资源并不多，那么，该从哪里开始准备机器学习面试呢？别再四处寻找了，我精心整理了这份指南（包含13个主题63个问题），它涵盖全面、不留死角，涉及广泛的机器学习主题，确保你即使面对最棘手的问题也能准备充分。

#机器学习 #人工智能 #面试

一文读懂深度学习中的损失函数quantifying loss —— 作用、分类和示例代码

在深度学习中，quantifying loss（量化损失）是指通过数学方法计算模型预测值与真实值之间的差异，以衡量模型的性能。损失函数（Loss Function）是量化损失的核心工具，它定义了模型预测值与真实值之间的误差大小。损失值越小，表示模型的预测越接近真实值。

#深度学习 #分类 #人工智能

5分钟速览深度学习经典论文 —— attention is all you need

Attention is All You Need 是一篇极其重要的论文，它提出的 Transformer 模型和自注意力机制不仅推动了 NLP 领域的发展，还对整个深度学习领域产生了深远影响。• 提出一种完全基于注意力机制（Attention Mechanism）的模型，摒弃递归和卷积结构，解决上述问题。• 在 2017 年之前，序列建模任务（如机器翻译）主要依赖于递归神经网络（RNN）和卷积神

#深度学习 #人工智能

深度学习五大模型全解析：CNN、Transformer、BERT、RNN、GAN 的区别与联系，一文读懂！

#深度学习 #cnn #transformer

5 分钟读懂 RNN循环神经网络和多层RNN：原理、Tensorflow代码和应用

RNN：RNN 是一种强大的工具，特别适合处理简单的序列数据，但存在梯度消失/爆炸问题。要结合实际任务选择合适的变体。多层 RNN：通过堆叠多个 RNN 层，增强了模型的表达能力，但计算开销更大。结合 LSTM/GRU：可以缓解梯度问题，适合处理复杂的序列任务。根据具体任务选择合适的模型结构和参数，通常需要结合实验进行调整。

#rnn #tensorflow #人工智能

一文读懂 AI 生态中人工智能、机器学习、神经网络与深度学习之间的关系

今天，我们将讨论人工智能、机器学习、神经网络和深度学习之间的相互关系。通过查看上面的图表（见本文的封面图片），我们可以得出以下结论。人工智能是一个广泛的领域。机器学习、神经网络和深度学习是人工智能的子领域。神经网络和深度学习是机器学习的特定领域。在学习神经网络和深度学习之前，你应该熟悉一般的机器学习知识。并非所有的神经网络都是深度学习模型。让我详细解释一下每个术语。

#人工智能 #机器学习 #深度学习 +1

技术小白也能上手！如何在AWS等公有云的EC2上自主部署DeepSeek R1

在你自己的基础设施上部署像 DeepSeek R1 这样的大语言模型（LLM），可以让你完全掌控数据隐私和自定义设置。在本指南中，你将学习如何在 AWS EC2 实例上使用 Ollama（用于本地大语言模型管理）和 nextjs-ollama-llm-ui（一个基于 Next.js 的用户界面，用于与模型进行交互）自行托管 DeepSeek R1。

#aws #云计算

共 28 条

请选择