logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型下半场,各行各业正被悄悄改写

AI并不是轻轻推一把的工具,而是正重新书写很多行业的运作方式。这种改变不是“提升效率”这么简单,而是正在对产业链条从上到下进行深度重构。看似悄无声息,其实已在制造、医疗、能源等传统行业内部,搅动出一场系统级的再造工程。过去几年,大家对AI的认知大多还停留在“大模型多强”“算力有多大”“数据有多全”的层面。但真正走入一线的人都知道:AI真正在起作用的地方,是流程、系统、认知乃至组织结构的底层逻辑正在

文章图片
#人工智能#AI
从零详细地梳理一个完整的 LLM 训练流程

在这篇文章中,我们将尽可能详细地梳理一个完整的 LLM 训练流程。包括模型预训练(Pretrain)、Tokenizer 训练、指令微调(Instruction Tuning)等环节。

文章图片
#人工智能#自然语言处理#语言模型
“兰台知音”是怎样炼成的? ——Agent+LLM+RAG架构之优秀实践

数字罗塞塔计划公众号已于今年元旦重磅推出“兰台知音”档案知识问答系统是不是看上去很简单的样子?赶紧问一个档案行业的业务或者技术问题测试一下,相信结果应该能让您满意。那这么一个看似界面简单实则功能强大的档案知识问答系统是怎么炼成的呢?今天我们就从技术层面来揭开“兰台知音”的神秘面纱。

文章图片
#人工智能#语言模型#自然语言处理 +1
一篇Agentic RAG全栈技术最新综述

2025年RAG技术并不会消亡,而是以新的范式得到更广泛、深入应用,2025新鲜出炉的Agentic RAG全栈技术综述:全面回顾了RAG的发展历程,从最初的到,再到和,每种范式都有优劣。作为最新范式,通过引入自主Agent实现了动态决策和工作流程优化。详细探讨了的基础原则、架构分类、关键应用,实施策略等全栈技术。

文章图片
#java#人工智能#自然语言处理 +2
手把手带你微调阿里qwen2.5大模型_qwen2.5微调

摘要 本文介绍了大模型微调(Fine-tuning)的基本概念与方法,并通过阿里魔塔社区实操演示了Qwen2.5模型的微调过程。微调是指在预训练基座模型基础上,使用特定领域数据优化模型性能,使其适应专业任务(如医疗报告生成)。常见微调方法包括SFT、LoRA等,各具优缺点。文章以阿里魔塔社区为例,详细展示了从注册账号、选择模型到启动GPU环境的完整流程,强调其低门槛特性(提供100小时免费资源)。

文章图片
#人工智能#AI
DeepSeek大模型边缘部署与应用——从技术革命到产业落地,重构智能未来

基于RKNN的本地大模型服务实现智能语音问答RKNN,即Rockchip Neural Network,是瑞芯微电子公司推出的一款深度学习模型开发和运行框架。DeepSeek大模型与M-Lab平台的深度融合,标志着AI技术从“云端高塔”走向“边缘战场”。无论是制造企业的实时质检、教育机构的智慧教研,还是基层政务的智能服务,边缘部署正在消除算力、成本、安全三大门槛,让顶尖AI能力成为触手可及的生产力

文章图片
#语言模型#人工智能
企业定制AI知识库:打造专属智能体

在当今数据爆炸的时代,虽然AI强大,但常规的AI工具或搜索引擎在面对复杂、专业领域的问题时,可能给出模棱两可的回应,无法满足企业精细化的需求。这就是为什么,企业需要一个专属的AI知识库—— 它不仅能存储你的数据,还能真正帮助你提取出所需的关键答案,训练你的模型。想象一下:当你需要某个项目的核心文档、某个复杂问题的精准解决方案时,不必再苦苦翻阅无数资料、盲目等待AI的回应。借助定制化的AI知识库,你

文章图片
#人工智能#自然语言处理
漫画趣解:一口气搞懂模型蒸馏!

最近,伴随着DeepSeek的火爆,「模型蒸馏」这个专业名词,也频繁出现在大众视野。什么是模型蒸馏呢?“模型蒸馏”就是把大模型学到的本领,用“浓缩”的方式教给小模型的过程,在保证一定精度的同时,大幅降低运算成本和硬件要求。

文章图片
#算法#自然语言处理#人工智能 +1
微调DeepSeek-R1蒸馏小模型详细过程

DeepSeek在开源 DeepSeek-V3 和 DeepSeek-R1 两个模型的同时,通过 DeepSeek-R1 的输出,蒸馏了 6 个小模型开源给社区,其中 32B 和 70B 模型在多项能力上实现了对标 OpenAI o1-mini 的效果。本教程是⼀个使⽤unsloth训练框架和LoRA技术,对DeepSeek-R1-Distill-Qwen-7B蒸馏后的小模型进⾏基于医疗领域公开数

文章图片
#语言模型#自然语言处理#人工智能 +1
零基础到斩获Offer(2026):大模型算法工程师面试通关与前沿实战全指南!(2026)

大模型算法工程师,这个被誉为“AI时代皇冠上的明珠”的岗位,正以平均月薪超6万、顶级人才年薪百万的数字吸引着无数技术人。然而,高薪背后是极高的门槛:一面是面试中要求手推公式、设计分布式训练系统、应对伦理安全拷问的深度考察;另一面是技术本身正以前所未有的速度迭代,从通用大模型卷向多模态融合、垂直领域深度赋能和AI智能体(Agent) 的实用化。

文章图片
#算法#人工智能#深度学习 +1
    共 521 条
  • 1
  • 2
  • 3
  • 53
  • 请选择