
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
我们将开发以大语言模型为功能核心、通过大语言模型的强大理解能力和生成能力、结合特殊的数据或业务逻辑来提供独特功能的应用称为大模型开发。开发大模型相关应用,其技术核心点虽然在大语言模型上,但一般通过调用 API 或开源模型来实现核心的理解与生成,通过 Prompt Enginnering 来实现大语言模型的控制,因此,虽然大模型是深度学习领域的集大成之作,大模型开发却更多是一个工程问题。

《The Rise and Potential of Large Language Model Based Agents: A Survey》是由复旦大学自然语言处理实验室和米哈游公司联合撰写的一篇综述性论文,发布于2023年9月14日。论文共48页,引用文献673条,全面探讨了基于大语言模型(LLM)的智能体的发展潜力和应用前景。文章首先回顾了智能体的哲学起源和技术发展,指出大语言模型因其强大的

在AI领域,常见的深度学习框架TensorFlow、PyTorch和Keras无疑是开发者们的得力工具,但随着模型规模的急剧膨胀,这些传统框架在应对大模型时往往会显得力不从心。比如Pytorch的分布式并行计算框架DDP(Distributed Data Parallel),尽管实现了数据并行,但是当模型大小超过单个GPU显存限制时显得捉襟见肘。此时,开发者往往只能手动进行复杂模型的参数拆分到各个

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模

本文从DeepSeek的独特优势出发,全面分享了DeepSeek的使用方法,包括:扔掉提示词模板的正确方式、让其 “说人话” 的方法、深度思考技能、强大文风转换器运用,以及使用禁区。《DeepSeek使用攻略》如下:注:本文所有技巧均来自真实案例,所有提示词都经过反复验证。如果你还在用各种"专业提示词"和"模板",那就是走错了方向。为什么?因为它的核心是大模型,不是大模型。让我用一个真实案例来说明

从Llama入手,体验中文大模型(Qwen/Baichuan/ChatGLM),掌握prompt工程后深入架构与微调。建议结合GPT/BERT等基础模型学习,底层技术相通。学习目标包括:掌握主流LLM技术架构、NLP基础(BERT/GPT/Transformer)、推理加速技术(TensorRT-LLM/vLLM)、Pytorch及分布式训练。参考项目推荐torchkeras和llm-action

金融、财务和保险等行业中的RAG应用系统,针对PDF和图片中的表格进行识别,具有非常重要的实际意义。在这些业务场景中,表格数据通常包含大量结构化信息,例如财务报表、资产负债表、保险理赔单、投资组合明细、信贷记录等。这些表格承载着企业运营、风险评估和决策制定等核心数据,因此对其进行准确、高效的识别和抽取至关重要。

在 Baeldung 上看到了一篇介绍基于 Java + LangChain 开发大语言模型应用的基础入门文章,写的非常不错,非常适合初学者。于是,我抽空翻译了一下。我的公众号应该有很多读者对这方面的知识感兴趣,希望这篇文章能够起到入门的作用。1. 简介

LLM驱动的智能体工作流(AgentWorkflow)已成为实现AGI的关键范式。研究表明,智能体工作流通过多层架构(UI层、管理层、协作层)实现复杂任务自动化,支持规划、工具使用、多智能体协作等功能。最新调研比较了24个系统,发现Qwen-agent、CrewAI等综合领先,80%系统已开源。典型应用涵盖医疗(TxAGENT)、金融(FinRobot)等领域。该技术采用DAG工作流表示,结合优化

AI大模型技术正重塑程序员职业发展路径,CRUD等传统开发模式面临淘汰。2025年行业将把"AI项目经验"设为硬性门槛,掌握大模型原理+应用技术+实战经验成为关键竞争力。本文提供完整学习路线:从系统设计、提示词工程到行业落地方案(电商、物流、医疗等),包含104G免费学习资源(书籍200本、视频教程、100套商业方案)。建议开发者尽快转型,把握AI时代先机,避免技术迭代带来的职业危机。学习路径覆盖








