
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
举个具体的例子:传统开发者可能会写一个代码编辑器的插件,实现“自动补全代码片段”功能;而AI应用工程师则会基于GPT-4或Llama 3,构建一个完整的Coding Agent——它能根据需求文档生成整套代码、自动运行测试用例、甚至在发现性能问题时调用性能分析工具优化代码,全程无需人工干预。换句话说,AI应用工程师不是被AI取代,而是成为AI的“操控者”,让AI成为自己提升效率的核心工具。

文章介绍了不同版本AI Agents(授权版、开源版、社区版、信创版)的应用场景,并提供了两个AI岗位招聘信息。AI应用工程师需负责企业级AI系统架构设计与功能开发,优化RAG、Agent等核心模块;大模型算法工程师则专注于具身智能AI agent开发与算法优化。岗位要求具备AI开发经验、熟悉主流框架及NLP技术,为有志于大模型开发的程序员提供职业方向。

Qwen3-VL-30B-A3B模型开源发布,含Instruct和Thinking两版本,两张4090即可运行。实测显示模型在OCR、内容理解、数学等方面表现优秀,但表格识别较弱。Thinking版本在图像理解、计算和图片排序上更佳。作为30B参数仅激活3B的MoE模型,它体积小性能强,适合端侧部署和微调,是开发者入门多模态大模型的理想选择。

Embedding是将无意义的符号(如词语、图像ID等)转化为机器可理解的低维、稠密向量的技术。它既能压缩数据提高计算效率,又能在向量空间中保留语义相似性,使相似对象在空间中距离更近。在传统深度学习中,Embedding广泛应用于NLP、推荐系统和计算机视觉;而在大模型时代,它成为语言模型、多模态模型和生成式模型的基础。Embedding本质上是机器理解世界的"坐标系"和"翻译器"。

越来越多企业已经落地 AI 智能体应用,我们会不约而同的发现,AI 智能体应用在企业落地 90% 的工作都是工程架构设计(软件工程),只有 10% 是真正的 AI 大模型。

文章介绍了"上下文工程"这一提示词工程的进阶方向,关注"给什么"而非"怎么写"。随着Token增加,模型记忆能力下降,需管理上下文状态。有效上下文工程需清晰提示、精确系统指令、简洁工具设计和适当示例。长期任务可采用压缩、结构化笔记或多智能体架构应对上下文限制。核心原则是找到最小的高信号token集,最大化预期结果概率。

Claude Sonnet 4.5被公认为目前最强编程模型,在SWE-bench上取得77.2%的成绩,可连续工作30多小时不涣散。它突破了电脑操作能力(OSWorld达61.4%),配合Chrome扩展可直接在浏览器完成任务。数学推理能力全面提升,在金融、法律、医学、STEM领域表现优异。产品更新包括checkpoint功能、VS Code扩展和API增强,同时开放了Claude Agent S

文章深度解析三大主流开源大模型(Qwen3、Llama3、GPT-OSS-20B)的文件结构与格式特性,详述权重文件、配置文件和分词器文件的作用与差异,提供Ollama和vLLM部署实践、文件格式转换工具及代码示例,并介绍Hugging Face与ModelScope资源平台使用技巧,为开发者提供从文件理解到模型部署的全流程技术指南。

文章系统介绍了大模型从基础理论到实践应用的完整技术体系,涵盖语言模型发展历程、Transformer架构、Bert与GPT模型对比、训练数据优化、推理性能优化技术(如连续批处理、PagedAttention、模型量化)及训练加速方法(混合精度训练、梯度累积等)。结合阿里云AI汽车行业实践经验,为开发者提供大模型落地的全栈解决方案。

本文介绍了企业落地大模型所需的5种核心能力:理解技术但不需编程、准确翻译业务需求、通过数据分析发现AI价值、识别并规避应用风险、保持对新技术的敏感度。提供了快速学习指南和实战案例,帮助小白和程序员有效推动企业AI应用落地,避免常见陷阱,实现技术与业务的完美结合。
