logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

GPT架构详解:从Transformer到大型语言模型

在人工智能领域,GPT(Generative Pre-trained Transformer,生成式预训练Transformer)无疑是近年来最具影响力的技术突破之一。从2018年GPT-1的首次亮相,到ChatGPT引发全球AI热潮,再到GPT-4展现出令人惊叹的多模态能力,GPT系列模型一直在刷新我们对自然语言处理可能性的认知。本文将深入剖析GPT的架构设计,探讨其背后的核心原理,帮助读者建立

文章图片
#transformer#深度学习#人工智能
Agent Skill设计模式和技巧

在任何技能中,最具价值的部分是“Gotcha”部分,也就是Agent可能踩的坑。例如,一个Standup Meeting发布技能可能会维护一个 standups.log 文件,记录每次发布的内容,这意味着下次运行时,Claude 可以读取自己的历史记录并告知自昨天以来发生了哪些变化。通过实施明确的菱形门禁条件(例如,在从文档字符串生成到最终组装之前需要用户批准),管道确保Agent无法绕过复杂的任

#设计模式#AIGC
给 StarRocks 插上 AI 的翅膀

数组(Array) 是数据库中的一种扩展数据类型,其相关特性在众多数据库系统中均有支持,可以广泛的应用于 A/B Test 对比、用户标签分析、人群画像等场景。StarRocks 当前支持多维数组嵌套、数组切片、比较、过滤等特性。

文章图片
#人工智能#AIGC
AIGC笔记

LLM大语言模型提示工程,使提问更加清晰RAG(Retrival-Augmented Generation检索增强生成),结合信息检索和生成式AI的技术架构,RAG 通过从外部知识库(如文档、数据库)中检索相关信息,并将其作为上下文输入给 LLM(大型语言模型),从而提高回答的准确性,减少幻觉问题微调,可以增强模型能力LangChain开源框架,允许开发人员将LLM与外部的计算和数据源结合起来对比

文章图片
#AIGC
Calcite执行计划优化

CBO与RBO并非对立关系,而是基于RBO的拓展CBO = RBO + Cost Model + Model Iteration,通过代价模型,在一定的时间空间范围内通过动态规划算法来获得最终的执行计划claicte的优化原理是,它假定如果一个表达式最优,那它的局部也是最优的。成本最优假设利用了贪心算法的思想,在计算的过程中, 如果一个方案是由几个局部区域组合而成,那么在计算总成本时, 我们只考虑

文章图片
#大数据#开源
何为“零拷贝”

内核态(Kernal Mode):内核有特别的权利,它能与设备控制器通讯, 控制着用户区域进程的运行状态。保护系统应用用户态(User Mode):非特权区域, 在该区域执行的代码就不能直接访问硬件设备。用户进程所在区域。DMA 直接内存存取(Direct Memory Access):是一种允许外围设备(硬件子系统)直接访问系统主内存的机制。接管了数据读写的工作,不需要 CPU 再参与 I/O

文章图片
#linux
ByteBuddy实战笔记

摘要:本文介绍了Java字节码增强框架ByteBuddy的核心功能,包括动态生成类、方法拦截和属性修改等技术。主要内容涵盖:1)动态类的三种生成方式(subclass/rebase/redefine)及其命名策略;2)方法拦截的不同实现形式,包括实例方法、静态方法和构造方法的动态修改;3)使用注解实现参数绑定和委托调用;4)Java Agent的实现方式和Advice内联织入技术。文中详细说明了各

文章图片
#java
到底了