logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

OpenAI的真正对手?DeepSeek-R1如何用强化学习重构LLM能力边界——DeepSeek-R1论文精读

2025年1月20日,DeepSeek-R1 发布,并同步**开源**模型权重。截至目前,DeepSeek 发布的 iOS 应用甚至超越了 ChatGPT 的官方应用,直接登顶 AppStore。DeepSeek-R1 一经发布,各种资讯已经铺天盖地,那就让我们一起来精读一下论文,看看引爆AI圈的 DeepSeek-R1 是如何炼成的?

文章图片
#开源
OpenAI的真正对手?DeepSeek-R1如何用强化学习重构LLM能力边界——DeepSeek-R1论文精读

2025年1月20日,DeepSeek-R1 发布,并同步**开源**模型权重。截至目前,DeepSeek 发布的 iOS 应用甚至超越了 ChatGPT 的官方应用,直接登顶 AppStore。DeepSeek-R1 一经发布,各种资讯已经铺天盖地,那就让我们一起来精读一下论文,看看引爆AI圈的 DeepSeek-R1 是如何炼成的?

文章图片
#开源
详解人工智能之确定性推理方法

文章目录推理的定义推理方式及其分类推理的方向冲突消解策略自然演绎推理谓词公式化为子句集的方法鲁宾逊归结原理1.命题逻辑中的归结原理(基子句的归结)2.谓词逻辑中的归结原理(含有变量的子句的归结)归结反演应用归结原理求解问题推理的定义推理方式及其分类1.演绎推理:一般 → 个体三段论式(三段论法)2.归纳推理:个体 → 一般完全归纳推理(必然性推理)不完全归纳推理(非必然性推理)3.默认推理(缺省推

#人工智能#深度学习#机器学习
人工智能的知识表示

智能是知识与智力的总和智能的特征:感知能力、记忆与思维能力、学习能力、行为能力(表达能力)人工智能:用人工的方法在机器(计算机)上实现的智能;或者说是人们使机器具有类似于人的智能。知识表示:将人类知识形式化或者模型化。知识表示方法:符号表示法、连接机制表示法。机器感知:使机器(计算机)具有类似于人的感知能力。以机器视觉(machine vision)与机器听觉为主。机器思维:对通过感知得来的外部信

#人工智能#机器学习#自然语言处理
【云原生】Docker镜像详解

镜像是一种轻量级、可执行的独立软件包,它包含运行某个软件所需的所有内容,我们把应用程序和配置依赖打包好形成一个可交付的运行环境(包括代码、运行时需要的库、环境变量和配置文件等),这个打包好的运行环境就是image镜像文件。只有通过这个镜像文件才能生成Docker容器实例(类似Java中new出来一个对象)。...

文章图片
#docker#云原生#运维
跨模态检索论文阅读:Dissecting Deep Metric Learning Losses for Image-Text Retrieval(GOAL)

提出了一个通用框架GOAL来全面分析现有深度度量学习损失函数的梯度更新,并应用这个框架来帮助寻找VSE问题的更好目标。提出了一种新的方法,通过用梯度目标家族来优化模型,而不是使用损失函数,直接处理图像-文本检索任务。展示了对现有方法的持续改进,在COCO数据集的图像-文本检索任务中取得了最先进的结果。

文章图片
#论文阅读#深度学习
改善深层神经网络:优化算法

动量梯度下降法的一个本质:想象你有一个碗,你拿一个球,微分项给了这个球一个加速度,此时球正向山下滚,球因为加速度越滚越快,而因为β稍小于1,表现出一些摩擦力,所以球不会无限加速下去,所以不像梯度下降法,每一步都独立于之前的步骤,你的球可以向下滚,获得动量,可以从碗向下加速获得动量。但要慢慢减少学习率的话,在初期的时候,学习率还较大,你的学习还是相对较快,但随着变小,你的步伐也会变慢变小,所以最后你

文章图片
计算机前沿高频词汇

convergencen.(不同思想、群体或社会的)趋同,融合;novel technology about acquiring and processing information全新的信息获取和处理技术architecturen.建筑学;体系结构; (总体、层次)结构;brieflyadv.简要地;some valuable applications are explained and for

#深度学习#神经网络#机器学习
详解人工智能之确定性推理方法

文章目录推理的定义推理方式及其分类推理的方向冲突消解策略自然演绎推理谓词公式化为子句集的方法鲁宾逊归结原理1.命题逻辑中的归结原理(基子句的归结)2.谓词逻辑中的归结原理(含有变量的子句的归结)归结反演应用归结原理求解问题推理的定义推理方式及其分类1.演绎推理:一般 → 个体三段论式(三段论法)2.归纳推理:个体 → 一般完全归纳推理(必然性推理)不完全归纳推理(非必然性推理)3.默认推理(缺省推

#人工智能#深度学习#机器学习
下一场范式革命:Transformer架构≠最终解法

如今,Transformer 仍是舞台中央的王者,但 “唯一解” 的神话正在悄然瓦解。一场关乎 AI 未来成本、速度与落地广度的架构之战,已在无声中打响。谁能在性能与效率的天平上找到终极平衡,或许就将定义下一个十年的技术航向。

文章图片
#transformer#架构#深度学习
    共 62 条
  • 1
  • 2
  • 3
  • 7
  • 请选择