logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型笔记9 Data Synthesis相关论文

CDS: Knowledge Component-Driven Data Synthesis Guided by Cognitive Diagnosis TheoryCDTKCsCDS方法流程1.模型评估KC标注流程第一步Prompt第二步Prompt构建Q-KC矩阵模型评估与错误案例收集2.诊断与数据合成全局策略细粒度策略全局合成的prompt细粒度策略prompt3.数据增强+数据选择数据增强

文章图片
#人工智能
大模型笔记8 文本数据清洗

格式改写Jsonl格式统计词条数目与长度分布重复性检测Topic去重Content元素去重句子去重n-gram去重去除content中空字符串低质内容检测多语言检测content统计时先拼接多换行标题检测读取label图形展示分层抽样1. 转换成dataframe格式2.分层抽样content文字长度中文比例多语言分词Magpie

文章图片
人工智能 5.搜索树求解

简单搜索:AI作为内核(算法、算力、大数据)。包括输入、输出、训练、搜索好坏评价。自然语言处理是搜索引擎最核心的基础技术。 包括了输入和输出,每一次的搜索行为都可以看做是对搜索引擎的一次训练,用户的点击来告诉搜索结果的好坏,从而展示出相对应的搜索排名。在这个过程中,搜索引擎不仅提高了推荐的准确性,还越来越懂得判断所收录结果的好与坏,渐渐学会了像人类一样去分辨网页。 在求解一个问...

#人工智能
人工智能 实验2.无监督学习方法(聚类)

实验二 聚类实验代码:http://www.17bigdata.com/%E4%B8%80%E4%B8%AA%E7%AE%80%E5%8D%95%E7%9A%84-kmeans-python%E5%AE%9E%E4%BE%8B/一、实验目的学习K-means算法基本原理,实现Iris数据聚类K均值聚类算法是先随机选取K个对象作为初始的聚类中心。然后计算每个对象与各个种子聚类中...

#聚类
人工智能 无人机基础

从技术角度的分类无人直升机、无人固定翼机、无人多旋翼飞行器、 无人飞艇、无人伞翼机、扑翼式微型无人机区分两个概念:无人机(飞行器)无人机系统(完成特定任务,包含其他传感器)多旋翼飞行原理飞行运动:通过每个轴上的电动机转动,带动旋翼,从而产生升推力。通过改变不同旋翼之间的相对转速,改变单轴推进力的大小,从而控制飞行器的运行轨迹。基本飞行动作(1) 四轴飞行器...

#人工智能
人工智能 2.知识表示

目录一阶谓词逻辑表示法谓词公式一阶谓词逻辑知识表示方法产生式表示法产生式的形式描述及语义——巴科斯范式BNF(backus normal form):框架表示法知识的概念:把有关信息关联形成的信息结构(if-then)知识的特性:相对正确性(一定环境)、不确定性(随机、模糊、经验、不完全)、可表示可利用知识的表示:知识形式化或模型化一阶谓词逻辑表示法产生...

#人工智能
人工智能 7.专家系统

7.1  专家系统的产生和发展  7.2  专家系统的概念  7.3  专家系统的工作原理 7.4  知识获取的主要过程与模式 7.5  机器学习 7.6  知识发现与数据挖掘 7.7  专家系统的建立 7.8  专家系统实例 7.9  专家系统的开发工具 特点:高度的专业化。         专门问题求解能力强。         结构、功能不完整。         移植...

#人工智能
人工智能 6.2群算法

用蚁群算法解决TSP问题,改进蚁群算法:最大最小最优保留 正反馈现象人工蚁群与自然蚁群相比有记忆功能(禁忌表)群的每个成员,称为一个个体。每个个体,其运动只遵循简单的规则。并且群成员之间是平等关系,而没有主从关系。由这些平等的、相互间能够协调运动的个体的集合,称之为“群”。蚁群算法原理蚂蚁先随意地对其巢穴周围的区域进行搜寻,并在走过的路上留下信息素。一旦一只蚂蚁找到了食物源,它会对...

#人工智能
人工智能 6.1遗传算法

全局优化(避免陷入局部极值-扩大种群规模)编码à求解à解码智能优化方法通常包括进化计算和群智能等两大类方法是一种典型的元启发式随机优化方法适应度函数(物竞天择)进化算法的概念详细介绍基本遗传算法这是进化算法的基本框架。然后介绍双倍体、双种群、自适应等比较典型的改进遗传算法及其应用。 编码方案:怎样把优化问题的解进行编码。适应度函数:怎样根据目标函数构建适应度函数。...

#人工智能
Uva208救火车(回溯)(T)

题目:The Center City fire department collaborates with the transportation department to maintain maps of the city which reflects the current status of the city streets. On any given day(任何一天), several..

#算法
    共 54 条
  • 1
  • 2
  • 3
  • 6
  • 请选择