
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
在数字经济高速发展的背景下,金融机构面临日益增长的信贷风险管控压力。传统基于专家规则与线性打分卡的信用评估方法存在主观性强、泛化能力弱、难以捕捉非线性特征等固有缺陷。本研究聚焦于构建一个端到端、可解释、高精度的客户信用评分预测系统,融合数据预处理、特征工程、多模型对比、模型集成与可视化服务于一体。系统采用Python语言开发,以Scikit-learn、XGBoost、LightGBM及SHAP可
本文设计并实现了一个基于Hadoop的电商用户行为数据分析系统。系统采用Flume收集用户行为日志数据,通过Kafka缓冲后存储到HDFS,利用Hive进行分层处理和数据仓库搭建,最终通过Superset实现可视化展示。研究解决了传统单机系统处理海量电商数据时的性能瓶颈问题,实现了从数据采集、处理到分析的全流程功能。系统测试验证了其可行性和可靠性,能够有效支持企业商业决策。未来可扩展元数据管理、实

随着高等教育信息化建设的深入推进,高校图书馆积累了海量、高维度、时序性强的图书借阅行为数据。然而,当前多数高校图书馆仍停留在基础借还管理阶段,缺乏对借阅数据的深度挖掘与智能分析能力,导致资源采购盲目、读者服务粗放、阅读推广低效等问题日益凸显。本研究以某省属重点高校2019–2023年真实借阅日志(含1,247,863条借阅记录、28,541种馆藏图书、42,319名注册读者)为数据基础,构建一套面
随着互联网应用规模持续扩张与微服务架构普及,服务器、中间件、应用层产生的日志数据呈爆炸式增长。传统单机ELK(Elasticsearch+Logstash+Kibana)栈在PB级日志场景下面临吞吐瓶颈、存储成本高、实时性不足及横向扩展受限等挑战。本文针对大规模分布式日志分析需求,设计并实现了一套基于Hadoop生态的离线+近实时混合日志数据分析系统。系统以HDFS为统一存储底座,采用Flume+
大数据对贫困人口采取了有效的帮助措施,由于灾害而重新陷入贫困的风险得到了有效的应对。在这样的环境背景下本文利用大数据技术,运用爬虫技术,通过echarts工具来实现大数据可视化,将数据直观简单明了的呈现出来,能够让更多的人读懂数据,了解2020年前脱贫后的数据变化、贫困地区分布、经济发展,城镇居民与农村居民恩格尔系数的变化等

本文设计并实现了一个基于大数据分析的用户行为推荐系统。系统采用C/S架构,使用Spring MVC框架开发,MySQL作为数据库,Hadoop集群处理离线数据。主要功能包括用户登录注册、商品推荐和购物车管理。通过协同过滤算法分析用户历史行为数据,生成共现矩阵和评分矩阵,实现个性化商品推荐。系统测试表明功能基本完善,但仍存在数据安全性和推荐准确性等问题,后续将优化加密算法和增加数据量以提高性能。该系

随着城市化进程加速和居民生活水平提升,我国生活垃圾年产量已突破2.5亿吨(住建部《2023年城乡建设统计年鉴》),传统人工分拣方式存在效率低、准确率差、人力成本高、二次污染严重等突出问题。为响应国家“双碳”战略与《“十四五”城镇生活垃圾分类和处理设施发展规划》政策导向,本研究设计并实现了一套端到端的基于深度学习的智能垃圾分类系统。系统采用改进型EfficientNetV2-S作为主干网络,融合注意
本文设计并实现了一个基于Hadoop的电商用户行为数据分析系统。系统采用Flume收集用户行为日志数据,通过Kafka缓冲后存储到HDFS,利用Hive进行分层处理和数据仓库搭建,最终通过Superset实现可视化展示。研究解决了传统单机系统处理海量电商数据时的性能瓶颈问题,实现了从数据采集、处理到分析的全流程功能。系统测试验证了其可行性和可靠性,能够有效支持企业商业决策。未来可扩展元数据管理、实

随着移动通信技术的迅猛发展和智能手机的全面普及,短信作为基础通信手段仍被广泛使用。然而,垃圾短信(Spam SMS)泛滥问题日益严重,不仅干扰用户正常通信体验,更成为电信诈骗、钓鱼攻击与恶意推广的重要载体。据中国信息通信研究院《2023年电信网络诈骗治理报告》显示,全年拦截垃圾短信超186亿条,其中含欺诈诱导内容的占比达37.2%,对社会公共安全与个人信息保护构成严峻挑战。本研究聚焦于构建高精度、
随着软件开发规模持续扩大与交付周期不断压缩,传统编码模式面临人力成本高、重复劳动多、错误率上升等瓶颈。人工智能,尤其是大语言模型(LLM)技术的突破性进展,为代码智能生成提供了全新范式。本文设计并实现了一套面向中小型开发场景的轻量化、可本地部署的AI代码自动生成系统——CodeSynth AI。系统以微调后的CodeLlama-7B模型为核心,融合语义感知提示工程(Semantic-Aware P







