logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

9.16-学习

datasets文件夹:存放需要训练和测试的数据集dataset.py : 加载数据集,将数据集转化为固定的格式,返回图像集和标签集model.py:根据自己的需求搭建一个深度学习模型config.py:将需要配置的参数均放在这个文件中,比如batchsize,transform,epochs,lr等超参数train.py:加载数据集,训练predict.py:加载训练好的模型,对图像进行预测。

#学习#深度学习#python
实习笔记7-transformer的language modeling解析-5(run_clm_no_trainer)

【代码】实习笔记7-transformer的language modeling解析-5(run_clm_no_trainer)

文章图片
#transformer#语言模型
实习笔记5-transformer的language modeling解析-3(run_clm结束)

目的是在标记化的过程中监控可能的问题,特别是针对输入文本长度的问题。这段代码使用 group_texts 函数将标记化后的数据集 tokenized_datasets 组织成适应模型输入的块,并生成一个新的数据集 lm_datasets。代码确保了 block_size 的合理设置,以适应模型的最大长度,并在用户指定块大小时进行相应的处理和警告。这段代码定义了一个名为 group_texts 的函

文章图片
#transformer#语言模型
大模型联网搜索汇总笔记

Searxng:免费的SearXNG集成与部署travily:有收费的,每个月1000的免费额度博查Web Search API:企业级的API接口,Dify中可以调用腾讯元器:先构建智能体进行发布,Dify直接调用。

OCRFlux 学习

最近ChatDOC团队发布了一款非常实用的多模态 OCR 大模型:OCRFlux-3B,这是一个基于 Qwen2.5-VL-3B-Instruct 微调得到的模型,专为文档解析任务优化,在解析 PDF、图片内容为 Markdown文本的效果上非常亮眼,尤其值得一提的是,它原生支持跨页表格与段落合并,这是目前开源 OCR 项目中首次实现该能力的模型。

#学习
Dify学习-16-儿童故事绘本- 儿童故事绘本文生视频语音合成版-实操版本

儿童故事绘本视频流,通过将静态绘本图片与专业录制的故事旁白相结合,制作出生动有趣的视听内容。

文章图片
#学习#音视频#windows
Dify学习-14-使用Pollinations进行文生图-超简单!!

使用Pollinations进行文生图很简单!

文章图片
#学习
Dify学习-16-儿童故事绘本- 儿童故事绘本文生视频语音合成版-实操版本

儿童故事绘本视频流,通过将静态绘本图片与专业录制的故事旁白相结合,制作出生动有趣的视听内容。

文章图片
#学习#音视频#windows
Dify学习-19-EXCEL数据如何建立知识库+知识库的学习ING

Args:"""定义类,继承自类文档字符串说明这个类用于加载Excel文件这个类提供了从Excel文件(.xls和.xlsx)中提取数据并转换为文档列表的功能。处理两种Excel格式保留超链接信息跳过空行将每行数据转换为键值对格式的文档在元数据中保留源文件信息对于.xlsx文件使用openpyxl处理,可以获取更多单元格信息(如超链接);对于.xls文件则使用pandas的xlrd引擎处理。

文章图片
#学习#python
    共 29 条
  • 1
  • 2
  • 3
  • 请选择