
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
摘要 DeepSeek是一家专注于人工智能的创新型科技公司,成立于2023年7月。其发展历程包括发布多个开源大模型,如DeepSeek LLM、DeepSeek-Coder、DeepSeek-V2/V3等,涵盖语言、代码、数学、视觉等多领域任务。DeepSeek模型技术特点包括性能强劲、开源免费、训练成本低,并采用了多头潜注意力(MLA)、混合专家模型(MoE)优化、多令牌预测(MTP)等先进架构

人机协同与AI Agent技术发展 文章探讨了生成式AI发展下的人机协同三种模式:嵌入模式(AI作为工具)、副驾驶模式(人机合作)和智能体模式(AI自主行动)。重点分析了AI Agent的基本框架,包括记忆、规划、工具使用和行动四大模块。文章还介绍了垂直领域AI Agent的实现路径,涉及LangChain框架的功能和组件,以及思维链(Chain of Thought)技术在提升大模型推理能力中的

为啥要搭建本地知识库?现在企业内部信息管理太难了,数据到处都是,检索效率低得可怜,还缺乏智能化支持。尤其是面对海量非结构化数据,企业很难快速提取有价值的信息,决策效率低得不行。要是能有个工具解决这些问题,那可太棒了!

AI时代如何安全高效管理知识?3步搭建本地私有智能知识库 在数据爆炸的今天,个人和企业普遍面临文档混乱、检索低效的痛点。本文提出基于DeepSeek+Ollama+AnythingLLM的零代码解决方案,通过三大核心技术——嵌入模型(语义编码)、向量数据库(智能检索)、LLM大模型(智能应答),实现本地化知识管理。 核心优势: 1️⃣ 数据100%私有,敏感信息不出内网; 2️⃣ 低成本部署,普通

RAG(检索增强生成)是一种结合信息检索与语言模型生成能力的自然语言处理技术,能够解决传统大语言模型(LLM)在开放域问题中的信息容量和时效性局限。通过动态接入外部知识库,RAG为LLM提供了即时扩展知识的能力,使其在问答、文本生成等任务中表现更精准。文章介绍了基于Ollama、Qwen2.5和AnythingLLM搭建本地知识库的实践方案,突出了RAG在特定领域知识应用中的优势。

《2025大模型AI系统化学习路线》摘要:本文系统规划了从入门到精通的大模型学习路径,包含数学基础(线性代数、微积分、概率统计)、编程语言(Python、TensorFlow/PyTorch)、深度学习基础(神经网络、CNN、RNN)、Transformer原理及变种模型(BERT、GPT)、预训练技术等核心内容。学习路线强调理论实践结合,提供分阶段学习目标和实战项目,并涵盖API开发、模型优化及

在2025年的今天,人工智能已不再是实验室里的“黑科技”,而是深刻重塑各行各业的核心驱动力。尤其在大模型(LLM)技术爆发式发展的背景下,企业对具备AI应用能力的工程师需求激增。而在这场技术浪潮中,一个被严重低估的群体——Java开发者,正迎来前所未有的转型黄金期。这不是空谈趋势,而是由真实数据和市场需求共同验证的结论。如果你是一名Java工程师,现在正是你转型为AI大模型应用工程师的最佳时机。

Meta公司发布了人工智能模型——Llama 3.1。那么Llama 3.1 405B的效果怎么样?我们来对比一张图,横向对比一下GPT-4。可以看出,Llama 3.1 405B在各类任务中的表现可以与GPT-4等顶级的模型相差无几。那么,我们怎样才能用到这款强大的Llama 3.1 405B模型呢?最直接的方式是通过Meta.ai平台,但目前这一途径仅对美丽国的用户开放。那有无适合平民用的大模

这里也给大家推荐一个非常全面的大模型项目,包含大模型相关技术原理以及实战经验(大模型工程化、大模型应用落地)。正如开源这个项目的作者所说,天下没有难学的大模型现在国内外还是比较缺乏全面成熟的大模型入门到精通教程,想比较于机器学习,深度学习等传统方向,入门大模型的难度还是比较大的。LLM的框架图如下,可以发现大模型现在也已经发展出挺多分支了,如果想要掌握所有的技术是需要一个比较系统的教程的,所以推荐

就在几年前,“通用人工智能”(Artificial General Inte11igence,AGI)似乎还是一个只存在于科幻小说中的概念,在现实中的实现方法仍在探索中。然而到了2022年,基于大语言模型的AIGC(AI Generated Content)领域的快速发展,使得通用人工智能不再那么遥不可及。研究人员发现,当参数量超过某个值时,基于大语言模型的AIGC系统就能够理解人类用自然语言发布








