简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
在项目中需要用到使用代码来编写一些结构化的文档,所以这里就需要涉及到一些需要用代码写world的一些工作,经过简单了解,python操作world最主要使用的就是python-docx文档,所以这次就先学一下这个库的操作,根据官方文档先简单学一些基础知识初步了解下。
使用Docker部署了一个python Flask框架的简单的服务程序,详细记录了,Docker下载,镜像构建和访问服务的全过程。
本文记录了,复现联邦学习论文中开展MNIST的 IID 训练的全过程,从预处理流程在一个电脑上模拟多个客户端,到下载数据处理数据,到训练代码的详细解释,到最后的结果对比,耗心耗力,终于是完成了。
实现了在Windows上部署通义千问的Qwen-7B-Chat Qwen-1.5-1.8B 模型且实现多轮对话和流式输出,目前还在更新。
这也是规划里的一篇工具文章,在写项目代码的时候不但要考虑代码的架构代码的后期维护和调试等也是一个比较关键的问题,之前写代码的时候日志这块的代码直接是任务驱动简单搜了一下就用了,但是秉持着打好基础的精神在这里也是总结一篇基础向的文档。在一个项目中在写代码时,除了要将训练代码运行起来运行稳定,也需要通过日志来记录,程序运行期间发生的事件,以便于了解系统活动和诊断。
本文记录了安装Latex2024的全过程,包括下载TexLive,TexStudio,然后生成快捷方式,最后使用TexStudio打开一个空白脚本运行一个Hello World 程序的全部过程。
前言为啥要写这个呢,在做课题的时候想着扩充一下数据集,尝试过这个过采样降采样,交叉采样,我还研究了一周的对抗生成网络,暂时还解决不了我要生成的信号模式崩塌的问题,然后就看着尝试一下别的,就又来实验了一下SMOTE,我看原理也不是很难,想着调库的话不如自己手搓一个稍微,可以简单理解一点的,最后呢也是成功了,然后呢对训练集进行了扩充,效果额,训练集准确率肯定是嗷嗷提升,训练的效果稳定了一点,但是测试集
在了解完了大语模型的基本知识,例如API的使用多轮对话,流式输出,微调,知识向量库等知识之后,接下来需要进一步补足的一个大块就是提示词工程,学习和了解提示词工程除了基本的提示词类型之外,不同的大模型对于提示词工程润色之后的提示词的反应如何,也是比较值得关注的一点,因此本文使用,文心一言4.0,通义千问,ChatGPT4, Claude3,四种模型来实验一下各类的提示词(自己花钱5555)。
使用Flask进行流方式输出,并探讨js中EventSource访问需要进行跨域响应头SSE格式的设置。
由于深度学习的会面临退化的问题,也就是当深度学习的网络加深到某一程度之后再加深会导致准确率降低,为了保证加深的网络的性能不低于浅层次的网络,为此2015年何凯明大佬发表了著名了ResNet残差网络,既再GoogLeNet在横向维度的创新之后,在网络结构上进行了新的创新。链接: ResNet原文地址结构的原理并不复杂,看一下从原文截取出来的这个残差结构,很好理解就是把输入最后加入到的输出上,构造一个