logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

一文读懂模型微调:让通用AI变成你的专属“小专家”

模型微调:让通用AI变成你的专属助手 模型微调是在预训练大模型基础上,用少量专属数据进行二次训练,使其适配特定需求的技术。它通过四个简单步骤实现:选择基础模型、准备专属数据、轻量训练、获得定制化模型。典型应用场景包括:客服话术定制、公司规范代码生成、标准化文档撰写等。与预训练和RAG技术相比,微调具有成本低、速度快、输出稳定的优势。当需要固定输出格式、处理垂直领域任务或要求稳定执行时,微调是最佳选

文章图片
#人工智能#深度学习#机器学习
什么是粗排和精排

摘要: 在RAG、推荐系统等场景中,粗排(Coarse-grained Ranking)和精排(Fine-grained Ranking)通过“先海选、再精选”的两级策略平衡效率与精度。粗排快速筛选候选集(如ANN算法),侧重召回率;精排精细化排序(如交叉编码器),提升准确性。该策略尤其适用于海量数据场景,避免全局精排的低效问题。LangChain与Milvus结合可实现:粗排召回候选文档,精排重

文章图片
腾讯 ChatBI 调研

腾讯ChatBI是一款基于大语言模型的智能数据分析工具,通过自然语言交互降低BI使用门槛。核心功能包括智能追问、秒级分析可视化、数据解读建议等,依托腾讯混元大模型实现意图识别、查询转换等关键技术。应用于企业运营、营销分析、决策支持等场景,相比竞品具备技术实力强、行业经验丰富等优势。未来将向模型优化、多模态交互、行业深度应用发展,推动企业数据智能化的同时面临技术迭代与市场竞争挑战。该产品显著提升了企

#大数据
Apache Paimon:为大规模数据场景打造 “统一存储语言”

Apache Paimon是Apache旗下开源的分布式表格式系统,定位为数据湖的组织层,融合数据湖与数据仓库优势,实现流批一体管理。它解决了传统数据仓库难以处理实时数据、数据湖缺乏事务一致性的痛点,通过分层存储、LSM优化和全链路事务三大核心技术,支持高效读写和数据可靠。Paimon在金融、电信、零售等行业应用广泛,为实时数据分析提供统一存储语言,成为构建实时数仓的关键组件。

#apache#大数据#数据库
python中f-string详解

Python3.6引入的f-string是一种高效字符串格式化方法,通过f/F前缀和{}直接嵌入变量或表达式。核心特性包括:支持算术运算、函数调用和三目运算等表达式;允许嵌套使用;需用双写{{}}转义花括号;通过:后缀控制格式(如精度、对齐);可用!r/!s获取repr()或str()结果。相比%和str.format()更简洁直观且性能更好,但需注意引号冲突、表达式内不能含反斜杠,且仅支持Pyt

#python#java#开发语言
shell读取文件最后一行数据

awk 'END {print}' file.txtsed -n '$p' file.txttail -n 1 file.txtshell实现获取文件最后一行有很多种实现方式,比如sed/awk都可以实现,要是获取一个大的文件,比如一个1000G的文件,此时用简单的sed和awk命令就很慢了,这个时候可以使用tail来实现。亲测没有问题!!!!...

#bash#linux#开发语言
使用flume将kafka数据sink到HBase

1. hbase sink介绍如果还不了解flume请查看我写的其他flume下的博客。接下来的内容主要来自flume官方文档的学习。顺便也强烈推荐flume 1.6 官方APIhbase的sink主要有以下两种。两种方式都提供和HBASE一样的一致性保证,即行级原子性1.1 HbaseSinkagent的配置时提供两种序列化模式:SimpleHbaseEventSer...

pip install 安装软件指定版本

1.在下载软件的后面加上==号,写上版本号。样例:pip install 软件名==版本号2.举例1.不加版本号:pip install clickhouse-driver2.指定版本号:pip install clickhouse-driver==0.2.1

#python
到底了