
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
中文分词、词性标注与词表示
本文介绍了中文NLP中的三大基础任务:分词、词性标注和词表示。在分词方面,详细讲解了精确模式、全模式和搜索引擎模式三种方法及其适用场景;在词性标注方面,强调了其在信息抽取和特征工程中的重要性;在词表示方面,对比了One-Hot向量和分布式/上下文向量的优缺点。文中提供了可运行的代码示例,并给出了工程实践建议:维护领域词典、繁简转换预处理、词性特征工程等。最后指出,扎实的基础处理是构建高质量NLP系
机器学习实战:逻辑回归算法深度解析与案例应用
本文深入探讨了逻辑回归算法在机器学习中的应用,通过三个实战案例展示其核心原理与实现方法。首先解析了逻辑回归的数学基础,包括Sigmoid函数和损失函数。案例1演示了癌症预测的完整流程,包括数据预处理和模型评估;案例2重点讲解了混淆矩阵和精确率、召回率等关键指标;案例3则展示了电信客户流失预测的建模过程,包含特征工程和可视化分析。文章还涉及高级特征工程技巧,如特征转换和聚合特征创建,为读者提供了从理
到底了







