
简介
读书破万卷
擅长的技术栈
可提供的服务
暂无可提供的服务
autoresearch 是 Andrej Karpathy 于 2026 年 3 月发布的自主 AI 科研 Agent 实验框架。其核心理念是:把一个真实的 LLM 训练环境交给 AI Agent,让它在你睡觉时自主做实验——修改代码、跑训练、评估结果、保留改进、丢弃失败,周而复始,而你只需要早上来看实验日志和(期望中)更好的模型。核心数字。
Autoresearch是Andrej Karpathy于2026年发布的自主AI科研框架,通过在nanochat基础上添加AI Agent实现自动化实验。该框架允许AI Agent自主修改代码、运行训练并评估结果,人类仅需通过program.md文件指导研究方向。在首次测试中,Agent完成了700次实验,筛选出20个有效改进,将训练时间缩短11%(2.02小时→1.80小时)。项目采用三大设计
autoresearch 是 Andrej Karpathy 于 2026 年 3 月发布的自主 AI 科研 Agent 实验框架。其核心理念是:把一个真实的 LLM 训练环境交给 AI Agent,让它在你睡觉时自主做实验——修改代码、跑训练、评估结果、保留改进、丢弃失败,周而复始,而你只需要早上来看实验日志和(期望中)更好的模型。核心数字。
Autoresearch是Andrej Karpathy于2026年发布的自主AI科研框架,通过在nanochat基础上添加AI Agent实现自动化实验。该框架允许AI Agent自主修改代码、运行训练并评估结果,人类仅需通过program.md文件指导研究方向。在首次测试中,Agent完成了700次实验,筛选出20个有效改进,将训练时间缩短11%(2.02小时→1.80小时)。项目采用三大设计
"新星计划"第四季来了!“新星计划”是 CSDN官方发起的一个旨在 发掘潜力新人、培养优质博主 为目标的创作活动,活动为期4周 ,本次很荣幸担任计算机视觉方向导师,希望大家多多参与交流,不限粉丝数,需要定期更新博客,报名更有机会获得在线答疑、经验分享与神秘奖品哦,参与方式与具体事项见链接。

《深入浅出多模态》系列之Flamingo模型解析: Flamingo是DeepMind推出的多模态视觉语言大模型,以少样本/零样本学习为核心突破。2022年首版通过模块化架构(冻结的ViT视觉编码器+Perceiver Resampler+语言模型)实现图文跨模态交互,支持连续对话和上下文学习。2024年Flamingo-2进一步开放权重,增强视频理解能力,在VQA等任务表现优异。其技术亮点包括:

《深入浅出多模态》系列文章聚焦多模态AI领域,本篇重点解析Flamingo系列模型。Flamingo由DeepMind研发,是few-shot/zero-shot视觉语言大模型的开创性工作,通过模块化架构(视觉编码器+Perceiver Resampler+语言模型)实现图文/视频多模态理解。2022年Flamingo-1支持上下文学习,2024年Flamingo-2开源权重并强化视频处理能力。该

机器学习-逻辑回归(非常详细)1. 模型介绍Logistic Regression 虽然被称为回归,但其实际上是分类模型,并常用于二分类。Logistic Regression 因其简单、可并行化、可解释强深受工业界喜爱。Logistic 回归的本质是:假设数据服从这个分布,然后使用极大似然估计做参数的估计。1.1 Logistic 分布Logistic 分布是一种连续型的概率分布,其分布函数和密
【机器学习】决策树——XGBoost、LightGBM主要介绍基于 Boosting 框架的主流集成算法,包括 XGBoost 和 LightGBM。1. XGBoostXGBoost 是大规模并行 boosting tree 的工具,它是目前最快最好的开源 boosting tree 工具包,比常见的工具包快 10 倍以上。Xgboost 和 GBDT 两者都是 boosting 方法,除了工程
《深入浅出多模态》系列之Flamingo模型解析: Flamingo是DeepMind推出的多模态视觉语言大模型,以少样本/零样本学习为核心突破。2022年首版通过模块化架构(冻结的ViT视觉编码器+Perceiver Resampler+语言模型)实现图文跨模态交互,支持连续对话和上下文学习。2024年Flamingo-2进一步开放权重,增强视频理解能力,在VQA等任务表现优异。其技术亮点包括:








