logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

数据采集与数据预处理(python)概述(一)

定义:网络爬虫是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。产生背景:随着网络的迅速发展,万维网成为大量信息的载体,如何有效地提取并利用这些信息成为一个巨大的挑战。网络爬虫的出现解决了这一问题,帮助人们从互联网上快速、高效地获取大量数据。定义:Robots协议是一种指导网络爬虫(或称为网络蜘蛛、机器人)访问和抓取网页的协议。背景:随着搜索引擎技术的发展,网络爬虫成为搜索引擎获取网页内容

文章图片
#python#开发语言
大模型学习计划(按周规划)

核心目标:梳理知识体系,明确长期方向每日任务:Day1-2:绘制大模型知识全景图,补漏薄弱点Day3-4:整理个人代码库(GitHub 托管),撰写 8000 字技术总结Day5-6:跟踪 NeurIPS/ICML 最新论文,选择 1-2 个深入方向Day7:输出知识全景图、代码库链接、1 年长期学习规划表难点:长期方向与自身基础的匹配性推荐资源:Google Scholar 学术趋势、Linke

#学习
大模型学习计划(按周规划)

核心目标:梳理知识体系,明确长期方向每日任务:Day1-2:绘制大模型知识全景图,补漏薄弱点Day3-4:整理个人代码库(GitHub 托管),撰写 8000 字技术总结Day5-6:跟踪 NeurIPS/ICML 最新论文,选择 1-2 个深入方向Day7:输出知识全景图、代码库链接、1 年长期学习规划表难点:长期方向与自身基础的匹配性推荐资源:Google Scholar 学术趋势、Linke

#学习
数据采集与数据预处理(python)概述(二)

HTTP和HTTPS在日常生活和工作中都有广泛的应用。HTTP主要用于网页浏览和API调用等场景,而HTTPS则更注重数据传输的安全性和隐私保护,适用于在线支付、登录系统等场景。随着网络安全意识的提高,HTTPS的应用范围也在不断扩大。

文章图片
#python#开发语言
大模型开发的基本流程

数据是AI系统的基石,这一阶段包括从不同渠道收集数据、清洗数据以去除异常值和重复项、对数据进行标注,以及将数据集分割为训练集、验证集和测试集,为模型训练和评估做准备。:在这一阶段,开发者需要设计和搭建整个应用的技术架构,包括选择合适的数据库、API接口和数据处理流程,以实现从用户输入到应用输出的全流程贯通。:在功能设计阶段,开发者需要确定应用的核心功能,并围绕这些功能设计上下游的辅助功能,以形成一

#人工智能
MySQL数据库学习笔记(1)——数据库基本操作、单表操作、多表操作

要在MySQL中创建数据库,你可以使用语句。这将创建一个名为的新数据库。如果需要,你可以在语句后面添加其他选项,比如指定字符集和校对规则。这会创建一个使用UTF-8字符集和utf8mb4_unicode_ci校对规则的数据库。

文章图片
#数据库#mysql#学习
大模型入门学习路径(个人学习路径的分享)

我个人是通过datawhale这个开源的组织社区去入门的大模型,上述推荐的很多也是来自这个社区,也是我认为比较好的一个开源社区,没有恰饭,单纯推荐!如果有任何侵权的地方,请联系我,会及时删除并道歉。

#学习#人工智能#语言模型
大模型入门学习路径(个人学习路径的分享)

我个人是通过datawhale这个开源的组织社区去入门的大模型,上述推荐的很多也是来自这个社区,也是我认为比较好的一个开源社区,没有恰饭,单纯推荐!如果有任何侵权的地方,请联系我,会及时删除并道歉。

#学习#人工智能#语言模型
启发式搜索算法

启发式搜索算法是一种解决问题的方法,它通过启发式函数(heuristic function)来引导搜索过程,以在大型搜索空间中快速找到最优解或者较优解。这种算法常用于解决那些由于搜索空间庞大而难以直接使用穷尽搜索(exhaustive search)方法求解的问题。启发式搜索算法的核心思想是,在搜索过程中,不仅考虑到当前状态的信息,还通过启发式函数估计了每个可能的下一步状态的“优劣”程度。这种启发

文章图片
#算法#数据结构
数据采集与数据预处理(python)概述(一)

定义:网络爬虫是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。产生背景:随着网络的迅速发展,万维网成为大量信息的载体,如何有效地提取并利用这些信息成为一个巨大的挑战。网络爬虫的出现解决了这一问题,帮助人们从互联网上快速、高效地获取大量数据。定义:Robots协议是一种指导网络爬虫(或称为网络蜘蛛、机器人)访问和抓取网页的协议。背景:随着搜索引擎技术的发展,网络爬虫成为搜索引擎获取网页内容

文章图片
#python#开发语言
    共 14 条
  • 1
  • 2
  • 请选择