logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【四阶魔方】基于Transformer的大语言模型+智能体

2023年被认为是AI元年(也许有不同的意见)。无论如何,AI的影响力已经扩大到了普通人的生活中,而且也许在不久的将来会迎来更多的突破。若干年后,回首今天,也许Transformer的大语言模型算法,框架,模型,智能体都将成为“经典”,共孩子们娱乐,成为他们(她们)的四阶魔方。

文章图片
#transformer#语言模型#深度学习
20250412 机器学习ML -(3)数据降维(scikitlearn)

数学小白一枚,看推理过程需要很多时间。好在有大神们源码和DS帮忙,教程里的推理过程才能勉强拼凑一二。* 留意: 推导过程中X都是向量组表达: shape(feature, sample_n);和numpy中的默认矩阵正好相反。

文章图片
#机器学习#人工智能
20241231 机器学习ML -(2)KNN(scikitlearn)

递推创建Tree;当前维度找中位数分割 数据集 left set,Node(mid), right set.* 循环维度(当log(Nsample)>featureSize)

文章图片
#机器学习#人工智能
20241230 基础数学-线性代数-(2)线性方程求解(numpy, scipy,scikitlearn)

线性代数理论及证明过程请参考教材。* 练习代码的实现很粗(极度简化,甚至在某些条件下错误的),目的是帮助自己(AI幼儿园水平)练习,验证,理解理论。* 开源库scipy/scikit-lean的实现是严谨非常强大的,同时API使用起来非常简单。

文章图片
#线性代数#人工智能
20250130 SingleAgent - LlamaIndex笔记

基于baseembeding模型,训练1个新的adapterembeding(本质上是加深了embeding网络的层数,甚至可以customize自定义更复杂的结构?基于LLM模型(任意),训练出1个新的微调后的FT_LLM。和(3)一样,llamaindex封装了openai的FT接口,数据上传,opanai云服务完成训练。用于从更强的模型(已学会相关知识/模式/风格等)“蒸馏”知识到相对小一些

文章图片
#人工智能#机器学习
20250315-OpenAI-AgentSDK实验

凑热闹。可以用GLM跑。这里暂时用GLM底座“魔鬼修改”,代码库仅供参考(共同进步吧)openai-agents-python-glm: 基于GLM底座运行SDK,学习实验SDK内的mAGT功能。

文章图片
#人工智能
【四阶魔方】基于Transformer的大语言模型+智能体

2023年被认为是AI元年(也许有不同的意见)。无论如何,AI的影响力已经扩大到了普通人的生活中,而且也许在不久的将来会迎来更多的突破。若干年后,回首今天,也许Transformer的大语言模型算法,框架,模型,智能体都将成为“经典”,共孩子们娱乐,成为他们(她们)的四阶魔方。

文章图片
#transformer#语言模型#深度学习
    共 11 条
  • 1
  • 2
  • 请选择