logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

AI_机器学习-5.机器学习概述

有大量标注数据→ 监督学习(或深度学习做监督)只有无标注数据→ 无监督学习(聚类/降维)或半监督学习(如果少量标注可行)标注成本高,但有无标注数据→ 半监督学习任务需要序列决策,有环境交互→ 强化学习(可结合深度学习成为深度强化学习)数据量大、问题复杂(图像、语音、文本)→ 深度学习(可能结合监督/无监督/强化)

#人工智能#机器学习
AI_机器学习-4.核函数扩展

方法核心任务核函数角色典型样本规模输出形式核岭回归 (KRR)非线性回归定义特征空间内积n<10^4点预测核逻辑回归 (KLR)非线性概率分类同上n<10^4类别概率核主成分分析 (KPCA)非线性降维捕捉数据流形n<10^4低维嵌入核 K‑Means非线性聚类使簇线性可分n<10^4簇标签高斯过程 (GP)贝叶斯回归/分类定义先验协方差n<2000均值+方差多核学习 (MKL)自动核组合融合异构

#人工智能#机器学习
AI_机器学习-2.Scikit-learn实战

标准化(Standardization):是一种数据预处理方法,将原始数据按特征列转换为均值为0、标准差为1的分布。其计算公式为:x 是原始特征值\mu 是该特征列的均值\sigma 是该特征列的标准差标准化后的数据服从标准正态分布(但不要求原始数据为正态分布)。问题答案标准化做了什么?将每个特征的均值变为0,标准差变为1为什么需要?消除量纲影响,加速收敛,公平正则化,满足算法假设数据性质变化?均

#人工智能#机器学习#scikit-learn
AI_机器学习-3.核函数基础

核函数核心公式关键参数最佳场景线性x_i^Tx_jC高维稀疏、线性可分多项式已知阶数、小样本RBF\gamma, C非线性问题默认首选拉普拉斯\gamma, C含噪声数据卡方\gamma, C直方图、非负特征直方图交无图像分类、直方图匹配Matern复杂(含贝塞尔函数)\nu,\rho高斯过程、空间统计掌握核函数的原理、数学形式和选择策略,是解决复杂非线性问题的关键。在实践中,建议从 RBF 核开

#人工智能#机器学习
AI_机器学习-1.机器学习基础概念

特征(Feature):输入变量,用于预测的属性(X)标签(Label):输出变量,需要预测的目标(y)训练集(Train Set):用于模型学习规律的数据测试集(Test Set):用于评估模型泛化能力的数据(从未见过的新数据)针对分类任务,评估指标主要用来衡量模型预测的准确程度。选择哪个指标,取决于具体问题(例如是否类别不平衡,更关注哪类错误)。所有指标都建立在混淆矩阵的基础上。业务目标首选指

#人工智能#机器学习
AI_Python基础-11.Matplotlib & Seaborn(可视化)

Matplotlib:底层绘图库,灵活性高,适合精细控制图表。Seaborn:高级封装,语法简洁,内置漂亮样式和统计功能。常用图形折线图:趋势散点图:相关性柱状图:比较直方图:分布箱线图:统计摘要热力图:矩阵数据pairplot:多变量关系美化要素:标题、标签、图例、颜色映射、网格、样式主题、去除多余边框。子图布局创建多子图,自动调整间距。实战流程:数据加载 → 数据处理 → 计算指标 → 绘制图

#人工智能#python#matplotlib
AI_Python基础-10.Pandas

Series:一维带标签数组;DataFrame:二维表格,类似 Excel。数据读取read_csvread_excelread_json,注意编码和参数。数据清洗dropnafillna处理缺失值;去重;条件过滤处理异常值。筛选loc(标签/条件)、iloc(位置)、布尔索引(df[条件]分组聚合groupby()agg()或,可自定义函数。合并concat拼接(行/列);merge按键连接(

#人工智能#python#pandas
AI_Python基础-8.并发编程基础

GIL:CPython 的全局解释器锁,导致多线程无法利用多核 CPU。多线程:适合 IO 密集型任务,注意线程安全(使用锁),可用。多进程:适合 CPU 密集型任务,绕过 GIL,进程间通信使用Queue或Pipe,可用。异步 IO:单线程高并发,使用asyncio+ 异步库(如aiohttp),代码复杂但效率极高。选择原则:CPU 密集型 → 多进程;IO 密集型 → 多线程或 asyncio

#python#开发语言
AI_Python基础-7.装饰器

装饰器本质:高阶函数,接收函数返回新函数,使用语法糖。:必须使用,以保留原函数的元信息(__name____doc__带参数的装饰器:三层嵌套函数,最外层接收装饰器参数,内层接收函数,最内层接收函数参数。类装饰器:通过__init__接收被装饰函数(或参数),通过__call__实现包装逻辑,适合保存状态。执行顺序:多个装饰器从下往上执行(靠近函数的最先被包装)。应用场景:日志、计时、缓存、权限校

#python#开发语言
AI_Python基础-6.迭代器与生成器

再次遍历(迭代器已耗尽,无输出)print(num)可迭代对象:实现了__iter__(),返回迭代器。常见的有liststrdict等。迭代器:实现了__iter__()和__next__(),只能遍历一次。for循环依赖迭代协议。生成器函数:使用yield的函数,调用时返回生成器对象(属于迭代器),支持延迟计算和状态保持。生成器表达式:类似列表推导式但使用(),返回生成器对象,适合大数据量处理

#python#开发语言
    共 51 条
  • 1
  • 2
  • 3
  • 6
  • 请选择