logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

LLM 系列(三):核心技术篇之架构模式

一个面向 Java 开发者的 Sring-Ai 示例工程项目,该项目是一个 Spring AI 快速入门的样例工程项目,旨在通过一些小的案例展示 Spring AI 框架的核心功能和使用方法。项目采用模块化设计,每个模块都专注于特定的功能领域,便于学习和扩展。欢迎感兴趣的小伙伴们关注和 Star。

文章图片
#架构
LLM 系列(五):模型推理篇

LLM 推理领域是一场与内存瓶颈和硬件利用率的持续战斗。本文梳理的各项优化技术,都是为了让日益庞大的模型变得更加实用和经济。更小、更高效的模型架构:业界正大力投入于研发更小但能力依旧强大的模型(如 Phi-3)以及稀疏化的专家混合(MoE)模型。MoE 模型在每次推理时只激活一小部分参数,从根本上降低了单次推理的计算和内存成本。软硬件协同设计:从到的演进,清晰地展示了算法如何紧随硬件特性(如 Ho

#人工智能
LLM 系列(一):发展历程篇

大语言模型技术演进综述(2017-2025) 本文系统梳理了2017-2025年间大语言模型(LLM)的技术演进历程。第一阶段(2017-2019)围绕Transformer架构突破,GPT-1、BERT等模型奠定基础。第二阶段(2020-2022)以GPT-3为代表,通过参数规模化和In-Context Learning实现能力跃升,中国厂商开始密集布局。当前阶段(2023-2025)呈现三大特

文章图片
#机器学习#人工智能#深度学习
LLM 系列(七):数学概念篇

的。在BERT的世界里,不存在一个脱离了句子的、抽象的“银行”的意义;只存在“河边的银行”和“取钱的银行”这样具体的、在语境中生成的意义。这种从静态到动态的演变,使得模型能够捕捉到语言中极其微妙和复杂的现象,为大语言模型的成功奠定了坚实的基础。

#机器学习#决策树#人工智能
基于 BGE-M3 构建 Embedding 服务(完整代码和镜像脚本)

本文主要是介绍基于开源 BGE-M3 构建 embedding 服务的完整过程,并提供了完整的代码。因环境不同或者主干代码分支差异,按照本文操作可能会出现一些不适配情况,具体问题具体解决。

#数据库
LLM 系列(五):模型训练篇

数据为王:高质量、多样化的训练数据是成功的关键工程化重要:大规模训练需要强大的工程化能力支撑持续创新:从预训练到强化学习,训练范式在不断演进协同发展:算法、硬件、数据、工程需要协同优化"大语言模型的训练,不仅仅是一个技术过程,更是人类智慧的结晶与传承。我们通过数学的语言,让机器学会了理解世界的方式;通过算法的力量,让人工智能获得了思考的能力。这个过程既充满挑战,也充满希望。

文章图片
#人工智能
LLM 系列(三):核心技术篇之架构模式

一个面向 Java 开发者的 Sring-Ai 示例工程项目,该项目是一个 Spring AI 快速入门的样例工程项目,旨在通过一些小的案例展示 Spring AI 框架的核心功能和使用方法。项目采用模块化设计,每个模块都专注于特定的功能领域,便于学习和扩展。欢迎感兴趣的小伙伴们关注和 Star。

文章图片
#架构
聊聊 API 管理-开源版 Yapi 到 SaaS 版 Apifox

theme: cyanosisAPI 管理这个话题近些年听到的频次越来越多,这本质上是个 web 领域的发展有关,也和开发协作方式有关--前后端分离代替了全栈工程师 hold all 的局面,强调的更多的是 API 复用、分工和协作细化。API 管理的重要性不言而喻,每家公司随着业务的发展,多多少少都会涉及到;从开源社区的产品到国内各类商业化产品,可以看到大家对于 API 管理...

#开源#yapi
SpringCloud-声明式服务调用 Feign

SpringCloud-声明式服务调用 Feign环境准备工程背景新建 sofa-eureka-consumer-feign修改pom文件修改配置文件启动类资源类启动 & 验证环境准备类别值JDK1.8.0_162SOFABoot/SpringBoot3.0.0/2.0.x.RELEASESpringCloudFinchley.RC1IDE...

到底了