m0_60610428 个人主页

@m0_60610428

m0_60610428

2023-02-23 16:55:53 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

AlignBench 数据集介绍以及使用指南

AlignBench 是第一个多维度全面评估中文大模型对齐水平的评测基准。

#人工智能

理解 LLM Function Call、Agent 调度与 MCP 协议

本文探讨了大语言模型（LLM）向具备工具使用能力的智能体（Agent）发展的关键技术。通过引入functioncall功能，LLM不仅能生成语言内容，还能调用外部工具执行任务，如查询天气、处理数据等。Agent负责调度任务、校验和执行functioncall，而MCP（ModelContextProtocol）则提供结构化上下文支持，确保多轮任务的一致性。三者协作形成智能系统：LLM生成调用请求，

#人工智能 #MCP

用TF-IDF权重打造更有信息量的词云

传统词云仅展示高频词，可能包含大量无意义词。TF-IDF（词频-逆文档频率）能识别文档特有且重要的词汇，提升词云信息价值。文章通过中文评论案例，演示如何用jieba分词和TF-IDF生成高质量词云。

#人工智能 #python #自然语言处理 +1

深入理解 jieba.cut 与 jieba.lcut：不仅仅是生成器和列表的区别

本文对比分析了jieba分词工具中cut与lcut两个接口的区别。cut返回生成器，采用惰性计算，适合处理大文本和流式数据，内存消耗更低；而lcut直接返回列表，使用更简便但资源消耗更高。通过源码解析和实验验证发现，两者不只是返回值类型不同，在运行机制、性能表现和适用场景上都有显著差异：cut适用于内存敏感的大规模文本处理，lcut更适合中小文本的即时分析。理解这些差异有助于在实际项目中合理选择分

#python #人工智能 #nlp +1

数据治理基础

本文介绍了数据治理的重要性、核心概念、技术架构。面对数据质量低下、标准不统一、权限混乱等问题，数据治理通过制度、流程和技术手段提升数据的质量、可用性与合规性。核心内容涵盖数据质量、元数据、主数据管理及权限、安全等七大要素，并提出“六层治理架构”，实现全流程标准化管理。

#人工智能 #大数据

理解 LLM Function Call、Agent 调度与 MCP 协议

#人工智能

到底了