
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
2023年被认为是AI元年(也许有不同的意见)。无论如何,AI的影响力已经扩大到了普通人的生活中,而且也许在不久的将来会迎来更多的突破。若干年后,回首今天,也许Transformer的大语言模型算法,框架,模型,智能体都将成为“经典”,共孩子们娱乐,成为他们(她们)的四阶魔方。

IDEA
数学小白一枚,看推理过程需要很多时间。好在有大神们源码和DS帮忙,教程里的推理过程才能勉强拼凑一二。* 留意: 推导过程中X都是向量组表达: shape(feature, sample_n);和numpy中的默认矩阵正好相反。

递推创建Tree;当前维度找中位数分割 数据集 left set,Node(mid), right set.* 循环维度(当log(Nsample)>featureSize)

IDEA
线性代数理论及证明过程请参考教材。* 练习代码的实现很粗(极度简化,甚至在某些条件下错误的),目的是帮助自己(AI幼儿园水平)练习,验证,理解理论。* 开源库scipy/scikit-lean的实现是严谨非常强大的,同时API使用起来非常简单。

基于baseembeding模型,训练1个新的adapterembeding(本质上是加深了embeding网络的层数,甚至可以customize自定义更复杂的结构?基于LLM模型(任意),训练出1个新的微调后的FT_LLM。和(3)一样,llamaindex封装了openai的FT接口,数据上传,opanai云服务完成训练。用于从更强的模型(已学会相关知识/模式/风格等)“蒸馏”知识到相对小一些

AI小白一枚,入门实验。

凑热闹。可以用GLM跑。这里暂时用GLM底座“魔鬼修改”,代码库仅供参考(共同进步吧)openai-agents-python-glm: 基于GLM底座运行SDK,学习实验SDK内的mAGT功能。

2023年被认为是AI元年(也许有不同的意见)。无论如何,AI的影响力已经扩大到了普通人的生活中,而且也许在不久的将来会迎来更多的突破。若干年后,回首今天,也许Transformer的大语言模型算法,框架,模型,智能体都将成为“经典”,共孩子们娱乐,成为他们(她们)的四阶魔方。








