logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

实战教程:如何评估大模型在垂直领域下的表现?

从领域文献生成测试集的提示词:判断题、单选题、多选题、简答题、开放问题的生成不同题目执行测评的提示词:从原始题目获取答案LLM 评估提示词:包括简答题和开放问题的评估具体的评分细则在创建任务中是可以配置的,实际影响的就是提示词中的变量,在这里的设置可以直接覆盖这个变量,自由度更高。理解通用基准在垂直领域的局限性,明确评估的三大核心目标(选型验证、微调效果、RAG优化)掌握三类垂直领域评估方法的适用

文章图片
#人工智能
Easy Dataset 已经突破 11.5K Star,这次又带来多项功能更新!

Easy Dataset(EDS)是一款AI智能应用,可将文献和图片中的知识转化为结构化数据集,用于模型训练和RAG场景。最新版本1.6.0新增图片处理、多轮对话数据集、问题模板等功能,支持数据清洗和智能评估。通过实际案例展示了汽车图片识别数据集和文本分类数据集的生成流程,包括图片导入、问题模板设置、智能标注和数据集导出等操作。

文章图片
#人工智能#语言模型#开源软件 +1
前端程序员原地失业?全面实测 Gemini 3.0,附三个免费使用方法!

最后我们来根据今天的实测结果总结一下结论。Gemini 3.0的前端能力确实超标,在小游戏开发,UI 设计稿还原,视觉效果开发这种对审美能力要求极高的需求中更是强的可怕。得益于Gemini原生多模态,以及强大的视觉理解能力,让他这种优势进一步放大了出来。特别是在有了这种工具的加持,让他在从零生成一个Web应用这个场景下更是是如虎添翼。另外,在指令遵循,需求理解的能力上,相比上一代的Gemini 2

文章图片
#前端#人工智能#AI
分析 100 万亿 Token 后,得出的当下 AI 现状的真相

2025 注定是要被载入 AI 史册的一年,大模型扎堆发布、开源生态空前繁荣…但技术突破的喧嚣之外,真实世界究竟发生了什么?大家好,欢迎来到 code秘密花园,我是花园老师(ConardLi)。最近, 发布了一份非常硬核的 AI 技术报告,它通过分析海量的 LLM 请求调用记录(超过 100 万亿 Token),能看到全球用户到底在用什么模型、干什么事儿、愿意花多少钱,并且试图绘制出一张最真实的

文章图片
#人工智能
(GIS可视化)ArcGis中属性连接、关联和空间连接的区别

ArcGis中属性连接、关联和空间连接的区别

#arcgis
Easy Dataset 已经突破 11.5K Star,这次又带来多项功能更新!

Easy Dataset(EDS)是一款AI智能应用,可将文献和图片中的知识转化为结构化数据集,用于模型训练和RAG场景。最新版本1.6.0新增图片处理、多轮对话数据集、问题模板等功能,支持数据清洗和智能评估。通过实际案例展示了汽车图片识别数据集和文本分类数据集的生成流程,包括图片导入、问题模板设置、智能标注和数据集导出等操作。

文章图片
#人工智能#语言模型#开源软件 +1
发布第五天,我的开源项目突破 1.7K Star!

多模型统一管理:支持OpenAI 标准协议的模型接入,兼容 Ollama,用户仅需配置模型名称、API地址、密钥即可完成适配。内置模型库预填主流厂商端点,支持删除/新增自定义模型,所有配置本地加密存储,保障数据安全。文本分块:设置最小/最大字符数(默认150-300字),支持递归分块时的章节感知(优先保留 Markdown 标题结构);问题生成:自定义每N字符生成1个问题(默认240字/问题),控

文章图片
#开源#人工智能#AI +1
指令控制 windows 电源选项

1.powercfg命令。使用powercfg.exe控制电源计划(也称为电源使用方案)。2.ac和dc一般电源有两种供电模式:ac代表交流电源dc代表直流电源一般情况下ac就是直接接通电源,dc是使用电池供电。一般电源命令都需要分别设置在ac和dc下的模式。3.电源选项的唯一标识每个电源选项都有一个唯一的guid标识,我们可以使用某些命令通过这个唯一标识来设定这个电源选项。例...

#windows
你必须知道的地理坐标系和投影坐标系

你必须知道的地理坐标系和投影坐标系

小白也能学会,教你低成本微调 DeepSeek,打造私人算命大师模型!

大家有任何问题,欢迎在评论区留言。评论关注是最大的支持 ⬇️❤️⬇️。

文章图片
#人工智能
    共 11 条
  • 1
  • 2
  • 请选择