logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

运筹帷幄——在线学习与实时预测系统

在我们过往的旅程中,无论是经典的线性回归、强大的梯度提升树,还是复杂的深度神经网络,其训练过程都遵循着一个共同的模式:批量学习(Batch Learning)。我们收集好一个庞大的、静态的数据集,将其视为对过去世界的完整快照,然后投入巨大的计算资源进行一次性的、耗时数小时乃至数天的模型训练。这种模式,本质上是一种数据考古学。我们挖掘历史遗迹(历史数据),试图从中总结出永恒不变的规律。然而,现实世界

#学习#人工智能#机器学习 +4
见微知著——特征工程的科学与艺术

摘要:特征工程的科学与艺术进阶 本章深入探讨特征工程的高级技术,将原始数据提炼为高效特征集。主要内容包括: 特征交叉:通过手动或自动方式(如因子分解机、深度交叉网络)揭示特征间隐藏的交互模式,突破线性模型局限。 目标编码:针对高基数类别特征,用目标变量统计量进行编码,并采用留一法或K折交叉防止数据泄露。 实践工具:介绍scikit-learn的PolynomialFeatures和category

文章图片
#人工智能#机器学习#神经网络 +4
登堂入室——深度学习的工程化实践与调优

本文探讨了深度学习从理论研究到工程化实践的关键过渡。首先强调了数据管道的重要性,指出专业数据管道需解决内存效率、计算效率和代码可维护性三大问题,并详细介绍了PyTorch中DataLoader和Dataset的最佳实践配置。其次深入分析了学习率这一核心超参数,比较了Step Decay、ReduceLROnPlateau和One Cycle Policy三种调度策略的特点,特别推荐了先增后减的单周

文章图片
#深度学习#人工智能#机器学习 +4
c语言:从指针到指针数组

指针变量是为了储存内存地址的一个变量,在我们创建一个变量的时候,就会在内存中申请一块区域,这块区域就是这个变量的地址。由于这个四个地址的序号都是连着一块的,当我们知道第一个字节的地址时,就可以顺便地推出另外三个字节的地址。所以为了方便,指针指向a时,实际上指向的是a的第一个字节。我们如何去取出一个元素的地址呢?这里就要介绍一个操作符了:&,取地址操作符。这样就会打印出a所占四个字节的第一个字节的地

文章图片
#c语言
无中生有——无监督学习的原理、算法与结构发现

数据本身蕴含结构,只需合适的透镜去观察。它不提供确定答案,而是提出假设——“这些样本可能属于同一类”、“数据可能位于这个低维流形上”。这种探索精神,正是科学发现的本质。下一篇文章,我们将进入模型评估与验证的领域——那里有偏差-方差权衡、交叉验证、A/B 测试,是确保模型可靠落地的关键。真正的洞察,往往始于对数据本身的敬畏与好奇。

文章图片
#学习#算法#人工智能 +4
从线性到非线性——神经网络的原理、训练与可解释性探索

神经网络通过多层非线性变换实现复杂函数逼近,其核心在于前向传播和反向传播机制。相比传统机器学习模型,神经网络擅长处理高维非线性数据(如图像、语音等),但计算复杂度更高。关键设计包括激活函数(如ReLU)引入非线性、损失函数匹配任务需求,以及通过反向传播高效计算梯度。尽管神经网络被视为"黑箱",但其本质是灵活的数学函数逼近器,而非模拟人脑。理解其数学原理和工程权衡,有助于在实际问

文章图片
#神经网络#人工智能#深度学习 +3
深度学习进阶(七)——智能体的进化:从 LLM 到 AutoGPT 与 OpenDevin

AI智能体正从单纯的语言模型向具备自主行动能力的系统进化。2023年后,ChatGPT等模型展示了理解意图、制定计划的能力,催生了AIAgent研究。AutoGPT首次实现LLM自主分解任务、调用工具,OpenDevin则构建了更结构化的多模块系统。关键技术包括记忆系统、工具调用及规划反思能力,使AI具备持续意识和元认知。当前智能体正从模块化工具链向系统级AI演进,未来或将形成具备感知、推理、学习

文章图片
#深度学习#人工智能
百度C++实习生面试题深度解析(下篇)

本文深入解析了百度C++实习生面试中的核心技术要点,主要涵盖以下内容:1)进程与线程机制,包括本质区别、Linux进程创建和C++多线程编程;2)TCP/IP协议栈,分析TCP/UDP差异、可靠性机制和拥塞控制算法;3)Linux系统调试技巧,如GDB使用和崩溃定位;4)网络协议与中间件,对比HTTP方法、WebSocket特性和Redis应用;5)设计模式与算法实践,详解单例模式实现和链表反转算

文章图片
#网络#tcp/ip#linux
从森林到梯度——梯度提升树的原理、调参与实战

grad = preds - labels # 一阶梯度hess = np.ones_like(preds) # 二阶梯度适用于 Quantile Regression、Focal Loss 等场景。梯度提升树不仅是算法,更是一种认知范式:承认当前模型的不完美,以谦卑之心,一步步修正偏差。复杂问题,可以分解为一系列简单修正;最优解,往往藏在误差的梯度方向里;真正的强大,源于对细节的极致把控。

文章图片
#机器学习#人工智能#自然语言处理 +4
深度学习进阶(八)——AI 操作系统的雏形:AgentOS、Devin 与多智能体协作

AI正从单一模型向系统化协作演进。早期大模型追求规模与精度,但存在记忆、调度等局限,催生了AutoGPT等智能体框架。多智能体协作(如ChatDev)通过角色分工实现任务并发,采用结构化通信协议提升效率。Devin首创AI工程师系统,集成开发环境与记忆管理,形成感知-行动-反馈循环。AgentOS雏形显现,包含智能体调度、记忆存储等模块,类似操作系统管理语义进程。当前框架如LangChain侧重工

文章图片
#人工智能#深度学习
    共 20 条
  • 1
  • 2
  • 请选择