
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
不论是英伟达 GPU 还是昇腾的 NPU,都可以「融为一体」,动态切分了。11 月 21 日,华为正式发布了 AI 容器技术 ——Flex:ai,同时,华为联合上海交通大学、西安交通大学与厦门大学共同宣布,将此项产学合作成果向外界开源,助力破解算力资源利用难题。

大模型本质是"文字接龙"系统,通过海量数据和庞大参数实现智能。其"大"体现在数据量、参数量和算力需求三方面。当规模达到临界点,会产生"涌现"现象,获得新能力。训练过程包括预训练、微调和价值观对齐,但存在"幻觉"缺陷。大模型作为新型生产力基础设施,将重塑所有行业,关键在于学会与AI协作。

中国大模型技术已进入全球第一梯队,百度文心大模型文本能力全球第二,GLM-4.6代码能力领先。文心大模型5.0采用原生全模态统一建模技术,支持多种信息输入输出。中国开源AI模型全球下载量占比17.1%,超越美国。大模型竞争已从参数扩展到底层算力、平台生态等全方位领域,广泛应用于电力、教育、医疗、金融等领域。

大语言模型(LLM)的评估正陷入一场“军备竞赛”——为了全面衡量模型能力,主流基准测试往往包含数千甚至数万道题目。例如HellaSwag有5608题,GSM8K有1307题,完整评估一次需耗费数天时间, computational成本高昂。更严重的是,静态评估将所有题目“一视同仁”,忽略了题目质量差异:3%-6%的题目存在“负区分度”(即越强的模型反而正确率越低,可能源于标注错误),却仍被计入平均

文章通过办公日常类比,解释了大模型在企业中作为"智能办事中心"的角色定位,将其分为通用、行业、场景和边缘四种类型。同时详细分析了"万卡集群"的建设意义和注意事项,指出单纯堆数量不可取,需关注算力利用率、数据质量和算法优化。强调大模型应用需"算力+数据+算法"三者结合,才能真正发挥企业AI赋能的价值。

本文全面梳理了15款国产主流大模型,包括阿里巴巴通义千问、百度文心系列等,指出MoE已成事实标准,激活参数集中在20B-50B。企业级应用更关注推理效率、稳定性和可部署性,国产大模型路线明确追求"在现实算力条件下可规模部署",而非单纯追求理论最强。

AI Agent是基于大模型的智能程序,能自主感知、规划、完成任务。其架构包括"大脑"(大模型核心能力)和"三件套"(规划、记忆、工具)。AI从"回答问题"进化到"主动办事",产业链上游为算力、算法、数据,中游有四类玩家,下游应用广泛。未来市场规模将爆发式增长,Meta Llama-4和OpenAI GPT-5等新模型将引领技术革新。对开发者而言,AI Agent既是挑战也是机遇,将重塑编程开发范

文章详细介绍了2026年AI Agent全栈开发的六阶段学习路线:觉醒期(基础交互与工具调用)、记忆期(RAG与向量数据库)、架构期(状态与工作流)、社会期(多智能体协作)、具身与实操期(Computer Use & Edge AI)以及工程化与落地期。强调当前是入局Agent开发的最佳时机,工具链已成熟并标准化,开发者可专注于智能流设计。每个阶段均列出核心目标、必学知识点和实战项目,帮助学习者循

AI Agent是今年热门技术,核心特征是"自主决策",区别于传统AI工具。它具备规划决策、工具调用、记忆学习三大能力,能根据任务动态调整步骤、循环迭代并利用上下文记忆。构建AI Agent需具备反思、工具使用、规划推理和多智能体协作四大能力。未来每个SaaS产品都可能被Agented版本重新定义,开发者应掌握Agent设计思维,成为设计智能体协作框架的专家。

文章介绍了AI Agent的概念、特征、与大型语言模型的关系、核心组件、工作流程、分类、应用场景及发展前景。AI Agent是一种能感知环境、决策并采取行动的智能系统,具备自主性、反应性、主动性等五大特征,由大语言模型、记忆、规划、工具使用四大核心组件构成,通过感知-思考-决策-行动-学习与反思的闭环工作流程运行。AI Agent已在多个领域应用,市场规模预计到2028年将达到285亿美元,但同时








