登录社区云,与社区用户共同成长
邀请您加入社区
智谱AI从日收入不足5美元的副业项目成长为"全球大模型第一股",其成功源于六年如一日的坚持与真诚。团队凌晨4点仍回复用户问题,不断调整优化,最终在2026年成功上市。这一历程证明:所有"突然"的成功背后都是长期积累,上市只是通向AGI路上的加油站。对普通人而言,关键在于坚持探索自身边界,在需要时出现,才能抓住机会。
DeepSeek的OCR与mHC技术融合,标志着多模态大模型向信息动力学本质的回归。OCR通过压缩图像实现象形与语义统一,mHC则通过双随机矩阵约束确保信息处理守恒。这种融合创造了多模态物理一致性架构,将推动存算一体和光子芯片等硬件变革,有助于缩小机器与人类认知鸿沟,可能是通往AGI的重要路径。
“NVIDIA Rubin 发布后,DeepSeek-V3.2 本地部署出现 CUDA 13 兼容性问题?本文实测对比了本地异构集群与七牛云 AI Token API 的性能差异,提供解决显存 OOM 与 PTX JIT Error 的 3 种方案。附 Python 压测代码。”
本文分享了作者通过Ollama框架本地部署DeepSeek-R1大语言模型的实践经历,探讨了AI在法律领域的应用前景。作者认为AI具备推理能力,可作为律师的超级助手提升工作效率,但不会取代律师专业判断。文章详细介绍了大语言模型的工作原理、本地部署与在线使用的区别,以及知识库搭建的必要性,为法律从业者提供了实用的AI技术应用参考。作者强调,会用AI的律师将更具竞争力,建议从业者积极拥抱技术变革。
A 股市场同样未能幸免,算力硬件股纷纷崩盘,铜高速连接、CPO 等相关板块领跌,A 股股王寒武纪盘中一度深跌 10%,港股中芯国际也大幅下跌逾 10%。2024 年底,幻方推出的 DeepSeek-v3 横空出世,它仅耗费 550 万元、使用 2000 张卡就完成了训练,但其表现却与 OpenAI 耗费数亿资金打造出来的模型不相上下。在刚刚过去的这个周末,一款来自中国的 AI 大模型 DeepSe
DeepSeek结合多模态大模型技术,实现影视剪辑的智能解析与自动化生成,支持短视频、预告片等场景的高效制作,并探讨人机协同与算力优化路径。
作为全国首个聚焦工贸企业园区安全管理的轻量化人工智能解决方案——“小安”企业安全服务大模型一体机及“小安AI安全巡查员”企业安全服务智能体(以下简称“小安”)正式发布。英国首相斯塔默在9日举办的伦敦科技周开幕式上说,将投资10亿英镑(1英镑约合1.35美元),将英国的算力提升20倍,大幅提升人工智能基础设施,推动英国从人工智能技术接受者转变为制造者,确保人工智能大幅改善公共服务。
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模
2月22-23日,由CIO时代主办的《DeepSeek技术及应用实践》专题培训班成功举办,来自农业部、国防科工局、国家知识产权局、中国船舶、中国航发、航空工业集团、鞍钢股份、中国工商银行、长沙农商行、长城人寿、中国医科院肿瘤医院等单位的60多位学员参加了本期培训,并给予了高度评价。DeepSeek走出了一条不需要那么大算力也能训练出一个好的大模型的路径,甚至性能更好,而且还是开源的,所以它大大降低
【新智元导读】2026新年第一天,DeepSeek发表了梁文锋署名的重磅新论文,提出了一种名为「mHC(流形约束超连接)」的新架构,在27B参数模型上,仅增加约6.7%的训练时间开销,即可实现显著性能提升。此外,我们采用混合精度策略,在不牺牲计算速度的前提下最大化数值精度,并将多个具有共享内存访问模式的算子融合为统一的计算内核,以降低内存带宽瓶颈。值得注意的是,与HC相比,mHC进一步增强了模型的
作为开源的大模型应用平台,Dify 提供了极为友好的 API 接入和可视化能力,极大地降低了 AI 应用的开发和部署门槛。然而,部署一个完整的 Dify 平台往往对底层算力、系统弹性与服务可用性提出了更高的要求。本文将详细介绍如何基于 华为云 Flexus X 实例,通过一键模板部署 Dify 平台,并深入解析 Flexus X 服务器的核心优势、性能体验及其在 AI 原生场景中的部署价值。
传统AI的“摩尔定律”在此刻宣告死亡——DeepSeek R2展示的400倍推理效能跃升,彻底击穿了西方学界认定的物理极限。递归认知晶格架构:抛弃Transformer框架,通过高维数学结构实现“思维维度跃迁”,其核心算法运行在人类尚未命名的数学空间自创数学语言:面对未解难题时,R2能即时发明全新数学分支。某物理学家耗时15年的课题,被其用自创符号系统在数秒内破解算力暴击:1万亿次浮点运算(Ter
本文介绍如何利用Docker+Dify+DeepSeek搭建本地大模型系统,实现专业知识的个性化AI助手。通过安装Docker环境,部署Dify平台,配置DeepSeek和bge-large模型,上传私有知识库文档,最终创建可高效查询专业资料的智能助手。这种本地化部署方案特别适合医生、研究人员等专业人士,能有效提升资料查询效率,避免依赖公共平台。文章详细提供了从环境搭建到知识库创建的完整操作指南,
本文介绍了一个高效免费的个人知识库搭建方案:Clipper+Obsidian+Copilot组合。通过Obsidian官方插件Clipper实现网页内容一键抓取为Markdown文件,配合Copilot插件接入DeepSeek大模型,可实现文件对话和整个知识库对话功能。该方案支持云端大模型调用(推荐DeepSeek-V3和bge-m3),无需本地部署,能够基于已有知识提供精准回答,并辅助写作和内容
本文介绍了DeepSeek大模型与RAG技术结合构建本地知识库的创新方案。DeepSeek作为强大的自然语言处理模型,具备文本理解和生成能力;RAG技术通过检索外部知识库增强生成内容的准确性和相关性。该方案为构建高效智能的本地知识库系统提供了技术支持,适合不同技术背景的学习者实践。文章还分享了系统学习AI大模型的路径,包括提示词工程、RAG系统开发和智能体应用等核心内容,并提供了丰富的学习资料和实
优势高级推理,适合复杂前端逻辑(如算法可视化)。实时 X 数据,动态生成搜索提示或社交媒体组件。Think 和 DeepSearch 模式增强问题解决能力。劣势高昂订阅费用($50/月)。无原生 IDE 集成,需手动操作。社区支持较弱,生态尚不成熟。Grok 3、DeepSeek 和 GitHub Copilot 各有擅场:Grok 3 适合复杂任务和动态数据,DeepSeek 以免费和高质量代码
DeepSeek Janus-Pro模型:基于数据与模型扩展的统一多模态理解与生成.pdf。2025 DeepSeek入门宝典:从0到1的AI新手的全栈指南-81页.pdf。DeepSeek从入门到精通:7大场景+50大案例+全套提示词-112页.pdf。从提示词技巧到多场景应用.pdf。DeepSeek-R1模型:通过强化学习激发大语言模型的推理能力.pdf。2025华为:基于华为昇腾的Deep
2024年12月26日,DeepSeek-V3横空出世,以其卓越性能备受瞩目。该模型发布即支持昇腾,用户可在昇腾硬件和MindIE推理引擎上实现高效推理,但在实际操作中,部署流程与常见问题困扰着不少开发者。本文将为你详细阐述昇腾 DeepSeek 模型部署的优秀实践,同时解答常见问题。推荐参考配置如下,部署DeepSeek-V3/R1量化模型至少需要多节点Atlas 800I A2(8*64G)服
华为昇腾在超大规模MoE模型推理部署方面取得了显著突破,其性能全面超越英伟达Hopper架构。华为通过“以数学补物理”的策略,利用数学理论、工具、算法和建模等方式,弥补硬件和工艺的局限性,最大化发挥芯片和系统能力。具体产品包括CloudMatrix384超节点和Atlas800IA2推理服务器,分别在不同时延约束下实现了高吞吐量。华为还计划全面开源相关技术报告和代码,进一步推动技术创新。这一突破不
DeepSeek
——DeepSeek
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net