logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

1.1 从图灵机到GPT,人工智能经历了什么?——《带你自学大语言模型》系列

本节主要从发展史的角度,梳理自AI诞生起经历了哪些阶段,从而让我们更清晰地认识到,当下我们是处在哪个位置?虽然今天正处于本轮AI的应用爆发初期,大家更感兴趣的是如何基于大模型做应用开发,但我仍然希望读者愿意花十几分钟的时间,去探索这个领域是如何走到今天的。对当下是否真的走在了”正确“的道路上,有自己辨证且深入的思考。与其杞人忧天 AI 产生智慧,我们更应该担心自己因为人云亦云从而失去智慧。

文章图片
#人工智能#语言模型
【微服务】Dubbo的最佳实践

以下是Dubbo的一些最佳实践整理,可以当做一张Dubbo的使用说明书,具体的原理分析后续再详写,这里就言简意赅的说明用法,且大部分来自官方文档:【一】服务化最佳实践分包服务接口、服务模型、服务异常等均放在 API 包中,符合REP(重用发布原则),CRP(共同重用原则)粒度服务接口尽可能大粒度,避免分布式事务,因为Dubbo暂未提供分布式事务支持。服务接口建议以业务场景为...

文章图片
#java
【SpringBoot】深入分析SpringBoot如何内嵌Tomcat容器

【一】总述SpringBoot的诞生,极大的简化了Spring框架的使用过程,提升了开发效率,可以把它理解为一个整合包,使用了SpringBoot,就可以不用自己去进行繁琐的配置,通过几个简单的注解,就可以构建一个基于REST的服务。同时,SpringBoot的快速构建部署的特性,为当下大热的微服务落地提供了极大的便利,可以说是构建微服务的理想框架。归纳来说SpringBoot的特性有如下几点..

文章图片
2.5 大模型数据基础:微调阶段数据详解

本篇对大模型微调阶段的数据集做一个详细的介绍,微调阶段一般需要的数据量较少,也会相对聚焦在某一类特定任务上。但数据的质量和多样性仍然起着十分重要的作用。所以,构建指令数据是个精细化的过程。

文章图片
#人工智能#语言模型#自然语言处理
2.4 大模型数据基础:预训练阶段数据详解 ——《带你自学大语言模型》系列

近年来,语言模型已经完成了向“预训练+微调/提示”范式的迁移,在这个范式下,预训练阶段要解决的关键问题是借助大规模语料资源,抽取那些语言的共性结构和关系,而微调阶段要解决的是如何借助小规模的专用数据集,进行模型能力的“垂直下沉”的问题,前者广,后者专。但无论如何,模型能力本质上是来源于所见过的训练数据,因此数据工程就变得极为重要。在训练过程中,高质量、大规模、多样化的数据集对于大模型训练至关重要。

文章图片
#语言模型#人工智能#自然语言处理
6.1 RAG 技术概览,从AI搜索谈起——《带你自学大语言模型》系列

后面计划开始写RAG系列了,前面的坑也会陆续填的。本节6.1.1聊聊Al搜索,非技术向的,6.1.2~6.1.6 是RAG技术向的,大家按需取用即可。

文章图片
#人工智能#语言模型#自然语言处理
【数据分析】UTM参数

由于目前的工作,有一部分是为运营提供一些流量分析的支持,所以一些相应的基础知识就不得不学起来了。目前其中一种需求,就是统计广告的投放效果,常规做法就是添加追踪,在追踪链中添加utm参数,这样对于数据平台的聚合统计就比较方便了UTM :“Urchin Tracking Module”的简写,中文的大概意思就是跟踪模块功能:追踪渠道来源,便于根据不同渠道、内容等细分数据,目的:精细化运营分析...

文章图片
到底了