logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

DeepSeek R1:推理模型的新突破与开源浪潮下的AI新势力

Open R1项目将以DeepSeek R1的技术报告为指导,分步骤完成复制工作,包括用DeepSeek R1蒸馏高质量语料库来复制R1-Distill模型,复制DeepSeek用来构建R1-Zero的纯强化学习pipeline,以及通过多阶段训练从基础模型过渡到RL版本。以Qwen系列为例,DeepSeek-R1-Distill-Qwen-1.5B是最小的蒸馏模型,在Math-500测试中达到了

文章图片
#语言模型#深度学习#人工智能 +2
在计算机视觉任务中,Transformer架构与CNN各自的优势和劣势有哪些?

例如,在目标检测任务中,Transformer能更有效地理解物体间的空间关联。Transformer可直接处理任意长度的序列输入,且能轻松融合多种模态信息(如位置编码、任务标识符),适用于多任务学习(如同时处理分类和分割)。自注意力机制的计算复杂度随输入序列长度的平方增长,对高分辨率图像(如手机拍摄的4K图片)处理时显存和计算开销巨大,难以直接部署到资源受限的设备。Transformer的自注意力

文章图片
#计算机视觉#transformer#cnn +4
【图像处理基石】如何入门AI计算机视觉?

以上内容已通过事实性验证,涵盖计算机视觉入门的核心知识、工具和实践方法,可作为可靠的学习指南。

文章图片
#人工智能#图像处理#计算机视觉 +2
DeepSeek 到底是什么类型的应用,其核心功能是什么?

DeepSeek 的本质是一个以生成式 AI 为核心的多场景智能平台,其功能不仅限于单一领域的自动化,更通过技术渗透推动行业创新范式重构。随着智能算力需求的增长,DeepSeek 有望进一步扩展至更多垂直领域,成为“AI+行业”融合的关键驱动力。DeepSeek 是一款多用途的人工智能工具,其核心功能基于大模型技术,覆盖内容生成、数据分析、个性化服务及复杂任务处理等多个领域。作为底层技术平台,De

文章图片
#python#生活#算法 +3
常用的图像配准算法有哪些?

传统方法(如SIFT、互信息)在特定场景下仍有效,但深度学习方法(如VoxelMorph、TransMorph)凭借自动特征学习能力成为主流。未来研究需聚焦无监督学习、多模态融合与实时性优化,同时兼顾模型的可解释性,以推动图像配准在医疗、遥感等领域的深度应用。

文章图片
#计算机视觉#人工智能#深度学习 +1
【图像处理基石】如何入门AI计算机视觉?

以上内容已通过事实性验证,涵盖计算机视觉入门的核心知识、工具和实践方法,可作为可靠的学习指南。

文章图片
#人工智能#图像处理#计算机视觉 +2
基带芯片的难点是什么?为什么苹果到今年才推出C1芯片?

基带芯片的研发是技术、专利、供应链和战略的综合博弈。苹果耗时近十年才推出C1芯片,既反映了技术攻坚的艰难,也体现了其在自主化道路上的长期布局。尽管当前C1仍有短板,但其标志着苹果向“全栈自研”迈出了关键一步,未来或将对高通等传统厂商构成实质性威胁。

文章图片
#生活#基带工程
DeepSeek R1:推理模型的新突破与开源浪潮下的AI新势力

Open R1项目将以DeepSeek R1的技术报告为指导,分步骤完成复制工作,包括用DeepSeek R1蒸馏高质量语料库来复制R1-Distill模型,复制DeepSeek用来构建R1-Zero的纯强化学习pipeline,以及通过多阶段训练从基础模型过渡到RL版本。以Qwen系列为例,DeepSeek-R1-Distill-Qwen-1.5B是最小的蒸馏模型,在Math-500测试中达到了

文章图片
#语言模型#深度学习#人工智能 +2
【图像处理基石】如何入门OCR技术?

【代码】【图像处理基石】如何入门OCR技术?

文章图片
#图像处理#人工智能#计算机视觉 +1
什么是scaling laws?

Scaling Laws 由 OpenAI 在 2020 年的论文《Scaling Laws for Neural Language Models》中首次系统提出,通过实验发现语言模型的性能(如测试损失)与模型参数规模、训练数据量、计算量之间存在幂律关系(Power Law)。Scaling Laws 是大模型时代的“导航图”,揭示了规模扩展对性能提升的重要性,但也需结合数据质量、架构创新和实际约

文章图片
#人工智能#机器学习#深度学习 +1
    共 19 条
  • 1
  • 2
  • 请选择