
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
MCP服务:https://mcpservers.org/MCP 终极指南:https://guangzhengli.com/blog/zh/model-context-protocolMCP与Function call的区别?目前的理解就是,MCP是一堆方法调用声明放到一个MCP服务中,不同应用的方法可以分别定义在不同的MCP服务中,然后大模型根据需要自己去取;而Function call就是把
上一篇已经介绍基础版的Lora微调实现过程,这一篇记录如何微调大模型使其输出带思维链。
FastMCP 的完整文档: https://gofastmcp.com/FactMCP安装指南:https://gofastmcp.com/getting-started/installation从官方 MCP SDK 的 FastMCP 1.0 升级到 FastMCP 2.0 通常很简单。核心服务器 API 高度兼容,在许多情况下,将您的 import 语句从更改为就足够了。
数据集:采用 GitHub 上的 Chinese-medical-dialogue-data 中文医疗对话数据集Github地址如下:微调模型:Qwen 1.5B模型(Qwen2、2.5均可以,可以自由选择)模型权重文件可以先从huggingface官网下载,或者从魔塔社区下载速度更快:本实验环境:GPU 显存 >= 8GB参考资料:more。
遗传算法的基本思想可归为三点:1)遗传:子代总是和亲代相似。2)变异:子代和亲代有某些不相似的现象。3)选择:具有精选的能力,它决定生物进化的方向。
理解循环神经网络的基本原理和计算过程,以及使用tensorflow实现RNN的基本方法。
关于神经网络的一些调参经验以下经验均是个人实践过程中总结得到的,不成系统,一点拙见~训练损失不下降关于训练损失不下降,根据我的一些经验和理论知识,可以从以下角度来分析首先,从数据集来分析:是否数据集存在比较多的标注错误?针对类似分类的项目,是否数据集分布不均衡,某些类别的样本数量太少?数据集特征不明显,举个验证码的例子,很多字符类的验证码,为了不让别人破解,会加上背景、斑点和干扰线等,如果这些干扰
本篇文章主要是自己刚接触NER领域时,研读这篇《 A Survey on Deep Learning for Named Entity Recognition 》NER综述论文时翻译的中文版,这篇综述时间是2020年,可能近两年的部分成果暂未包含,很多内容是通过百度翻译直接翻的,部分内容进行了一定的调整。有少部分内容省略了,具体可以参考原论文,所有涉及的文献引用也请参考原论文。
聚类算法是一种无监督学习算法,监督学习指的是我们的训练数据有一系列标签,我们通过假设函数去拟合它,而在无监督学习中,我们的数据不带有任何标签







