logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

本地Ollama部署DeepSeek R1模型接入Word

上一篇文章中我们通过API key的方式,实现了DeepSeek与Word的有机结合,帮助我们提高办公效率。而DeepSeek由于近期服务器压力较大,暂时停止了API key的注册服务,那么要想实现DeepSeek与Word的结合,我们也可以通过本地部署的方式进行。本地处理减少网络传输,响应速度更快。且本地部署的稳定性更强,不受网络波动影响,确保服务持续可用。文本数据无需上传至外部服务器,降低了泄

文章图片
#数据库#php#开源 +1
DeepSeek实现低成本训练,原来是靠它!

DeepSeek推出的最新推理模型,以500万美元的训练成本,比肩数亿美元成本的OpenAI o1,离不开各种优化策略,除了之前提到的“知识蒸馏”以外,还包括今天的主角MoE。在机器学习和深度学习领域,模型的设计和优化一直是研究的核心。近年来,一种名为Mixture of Experts (MoE) 的模型架构逐渐引起了广泛关注。MoE模型通过结合多个“专家”模型的优势,能够在处理复杂任务时表现出

文章图片
#学习#自然语言处理#人工智能
揭秘DeepSeek R1大模型:它如何像人类一样“思考”?

DeepSeek R1的诞生,不仅是技术的突破,更预示着人机协作的新纪元。当它走进千行百业,或许我们会发现:最惊艳的创新,往往始于对人类思维本质的深刻理解。

文章图片
#学习#自然语言处理#人工智能
揭秘DeepSeek “省钱”妙招:减少硬件依赖,绕开人工反馈来训练模型

当地时间周五,美国总统特朗普会见了英伟达 CEO 黄仁勋,两人讨论了 DeepSeek 和 AI 芯片出口等问题。美国立法者们也已敦促特朗普考虑对 DeepSeek 使用的英伟达芯片进行新的限制。与此同时,美国正在调查 DeepSeek 是否通过位于新加坡的半导体公司使用了英伟达禁用芯片。目前,美国五角大楼已经开始封锁使用 DeepSeek,美国海军则在上周就已禁用 DeepSeek。(来源:Re

文章图片
#语言模型#机器学习#人工智能
如何构建和优化推理型大模型?DeepSeek R1的启示

在AI领域,「推理模型」特指能够处理多步骤复杂任务的大型语言模型(LLMs)。与简单的事实问答(如“法国的首都是哪里?”)不同,推理模型需要拆解问题、生成中间步骤,最终得出答案。例如:数学题:计算7^999的最后一位数字,需通过观察幂次循环规律(7→9→3→1)并取余推导。逻辑谜题:16个球中一半是高尔夫球,其中一半是蓝色,需分步计算总数。编程挑战:验证代码的正确性并推导解决方案。这类模型的输出通

文章图片
#人工智能#pycharm#机器学习 +2
揭秘DeepSeek内幕:清华教授剖析AI模型技术原理

A:这个“能力密度”的概念是我们最近半年提出的。关于如何有效地、准确地衡量能力密度,大家可以参考我们发表在 arxiv 上的论文,论文题目是《Densing law of LLMs》(论文链接:https://arxiv.org/pdf/2412.04315v2)。所谓的能力密度,可以理解为模型在各种评测集上展现出来的能力,除以其参数规模,或者说是激活的参数规模。我们观察了过去一年半发布的代表性模

文章图片
#人工智能#学习#自然语言处理 +1
PyCharm接入DeepSeek实现AI编程

DeepSeek 是一家专注于人工智能技术研发的公司,致力于开发高性能、低成本的 AI 模型。DeepSeek-V3 是 DeepSeek 公司推出的最新一代 AI 模型。其前身是 DeepSeek-V2.5,经过持续的优化和升级,V3 版本在性能、速度和成本方面都取得了显著提升。DeepSeek-V3 的发布表明,国产 AI 模型在技术层面已经具备与国际顶尖模型(例如 GPT-4o)竞争的实力。

文章图片
#pycharm#ide#语言模型 +1
感谢deepseek,20天赚了15000

蛇年最火的一个方向当属 deepseek,可以说是平地一声雷。我几乎每天都在找机会试用 deepseek,并且想在节后把 API 接入到技术派中,作为大家简历上的一个亮点。我去淘宝搜了一下,目前有教大家在本地部署 deepseek-R1的教程,一份卖 25 元,已经售出 600 多份,粗略估算就有 15000 元。如果没记错的话,官方发布 R1 版本是在 1 月 20 号左右,满打满算也就 22

文章图片
#语言模型#人工智能#机器学习
什么是推理大模型?DeepSeek R1推理大模型与DeepSeek V3模型的区别是什么?什么时候该使用推理大模型?

其实,虽然OpenAI o1大模型发布的时候强调了它推理能力的大幅提升,但实际上OpenAI并没有给出明确详细的推理大模型的定义。在OpenAI的官网上,OpenAI定义推理模型是在回答之前进行思考,并在回复用户之前,在内部生成一长串的思维链过程。思维链是一种提示大语言模型进行逐步推理的方法。它让模型在得出最终答案之前,先显式地写出推理的中间步骤。这就像人类解决复杂问题时会先把思考过程写下来一样。

文章图片
#人工智能#机器学习#深度学习 +2
证书到手✓三种数据分析师证书对比!!!

证书到手✓三种数据分析师证书对比!!!

#https#服务器#ssl
    共 47 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择