weixin_46449024 个人主页

@weixin_46449024

weixin_46449024

2023-01-18 21:44:31 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

【四阶魔方】基于Transformer的大语言模型+智能体

2023年被认为是AI元年（也许有不同的意见）。无论如何，AI的影响力已经扩大到了普通人的生活中，而且也许在不久的将来会迎来更多的突破。若干年后，回首今天，也许Transformer的大语言模型算法，框架，模型，智能体都将成为“经典”，共孩子们娱乐，成为他们（她们）的四阶魔方。

#transformer #语言模型 #深度学习

idea自动编译不生效

IDEA

#scala

20250412 机器学习ML -（3）数据降维（scikitlearn）

数学小白一枚，看推理过程需要很多时间。好在有大神们源码和DS帮忙，教程里的推理过程才能勉强拼凑一二。* 留意：推导过程中X都是向量组表达: shape(feature, sample_n);和numpy中的默认矩阵正好相反。

#机器学习 #人工智能

20241231 机器学习ML -（2）KNN（scikitlearn）

递推创建Tree；当前维度找中位数分割数据集 left set，Node(mid), right set.* 循环维度（当log(Nsample)>featureSize)

#机器学习 #人工智能

idea自动编译不生效

IDEA

#scala

20241230 基础数学-线性代数-（2）线性方程求解（numpy, scipy，scikitlearn）

线性代数理论及证明过程请参考教材。* 练习代码的实现很粗（极度简化，甚至在某些条件下错误的），目的是帮助自己（AI幼儿园水平）练习，验证，理解理论。* 开源库scipy/scikit-lean的实现是严谨非常强大的，同时API使用起来非常简单。

#线性代数 #人工智能

20250130 SingleAgent - LlamaIndex笔记

基于baseembeding模型，训练1个新的adapterembeding（本质上是加深了embeding网络的层数，甚至可以customize自定义更复杂的结构？基于LLM模型（任意），训练出1个新的微调后的FT_LLM。和（3）一样，llamaindex封装了openai的FT接口，数据上传，opanai云服务完成训练。用于从更强的模型（已学会相关知识/模式/风格等）“蒸馏”知识到相对小一些

#人工智能 #机器学习

20241230 AI智能体-用例学习（LlamaIndex/Ollama）

AI小白一枚，入门实验。

#人工智能

20250315-OpenAI-AgentSDK实验

凑热闹。可以用GLM跑。这里暂时用GLM底座“魔鬼修改”，代码库仅供参考（共同进步吧）openai-agents-python-glm: 基于GLM底座运行SDK，学习实验SDK内的mAGT功能。

#人工智能

【四阶魔方】基于Transformer的大语言模型+智能体

#transformer #语言模型 #深度学习

共 11 条

请选择