
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
这是本项目的开篇,在这个小项目中,将要基于爬虫和GUI编程写一个写个小工具,目的是不用打开浏览器,也能搜到一些关键信息,并将这些信息持久化保存下来,读者可以对这些数据进行分析,比如舆情分析,或作为 NLP 的语料输入。众所周知,搜索引擎的一个核心技术就是爬虫技术,各大搜索引擎的爬虫将个网站的快照索引起来 ,用户搜索时,输入关键词并回车后,基于搜索引擎的浏览器就将相关信息按照一定排序规则展现给用户,
微博签到数据集,目前全网搜到的多为较老的 800w 数据集或已下线的接口,没有多大参考价值。所以自研了一个系统,可以抓取全国任意城市的微博签到数据,单城市签到微博去重最多可达 100w+,字段包括经纬度、签到地点、微博链接、博主链接、内容、图片链接(图片可下载)、发布时间、转评赞数等数十个字段。下面是深圳 2022 年 4 月底最新微博签到数据集:共计 50w,csv 文件 330M。除了深圳,全
本文分享了如何利用大模型(LLM)、RAG、MCP和Agent技术构建智能化产品反馈分析系统。通过自建MCP Server统一数据接入,结合企业微信机器人实现自动报告发送,并部署到腾讯云LightHouse。系统由Prompt工程驱动LLM完成数据采集、智能分析和报告生成全流程,显著提升了传统企业数据处理的时效性和智能化水平。最终实现了从数据采集到分析决策的全自动闭环,为企业数字化转型提供了可落地

本文介绍了一款基于大模型的基金分析工具开发过程。作者针对基金数据查询和分析耗时的问题,开发了一款整合基金行情和行业新闻数据的Web工具。该工具通过搭建两个MCP Server(基金数据查询和新闻查询服务),采用SSE长连接方式进行数据传输,并接入腾讯混元大模型作为分析引擎。文章详细介绍了MCP Server的开发部署过程,包括数据接口封装、服务配置、Nginx反向代理优化等关键环节,最终实现用户只

本文介绍了一个基于大模型的基金分析工具网站开发过程。作者通过MCP(Model Context Protocol)技术接入实时基金数据,采用FastMCP框架开发数据服务,并选择Gemini-2.5-flash作为基座大模型。该工具支持输入基金代码和时间段后,自动获取并分析基金历史表现和相关新闻影响,以通俗易懂的方式呈现分析结果。系统采用Streamable HTTP传输机制,结合数据缓存优化性能

本文介绍了一个基于大模型的基金分析工具网站开发过程。作者通过MCP(Model Context Protocol)技术接入实时基金数据,采用FastMCP框架开发数据服务,并选择Gemini-2.5-flash作为基座大模型。该工具支持输入基金代码和时间段后,自动获取并分析基金历史表现和相关新闻影响,以通俗易懂的方式呈现分析结果。系统采用Streamable HTTP传输机制,结合数据缓存优化性能

本文分享了如何利用大模型(LLM)、RAG、MCP和Agent技术构建智能化产品反馈分析系统。通过自建MCP Server统一数据接入,结合企业微信机器人实现自动报告发送,并部署到腾讯云LightHouse。系统由Prompt工程驱动LLM完成数据采集、智能分析和报告生成全流程,显著提升了传统企业数据处理的时效性和智能化水平。最终实现了从数据采集到分析决策的全自动闭环,为企业数字化转型提供了可落地

本文介绍了一款基于大模型的基金分析工具开发过程。作者针对基金数据查询和分析耗时的问题,开发了一款整合基金行情和行业新闻数据的Web工具。该工具通过搭建两个MCP Server(基金数据查询和新闻查询服务),采用SSE长连接方式进行数据传输,并接入腾讯混元大模型作为分析引擎。文章详细介绍了MCP Server的开发部署过程,包括数据接口封装、服务配置、Nginx反向代理优化等关键环节,最终实现用户只

微博签到数据集,目前全网搜到的多为较老的 800w 数据集或已下线的接口,没有多大参考价值。所以自研了一个系统,可以抓取全国任意城市的微博签到数据,单城市签到微博去重最多可达 100w+,字段包括经纬度、签到地点、微博链接、博主链接、内容、图片链接(图片可下载)、发布时间、转评赞数等数十个字段。下面是深圳 2022 年 4 月底最新微博签到数据集:共计 50w,csv 文件 330M。除了深圳,全
去广告,屏蔽关键词,拉黑用户,组织乱序微博按照时间线排列等多功能,并且开源。








