Al leng 个人主页

@secret2316352792

Al leng

2023-10-20 11:36:20 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

从零手写RNN诗歌生成器：逐行代码解释+数学案例彻底搞懂

数据预处理：把文本转换成ID序列数据集构建：用滑动窗口生成(x,y)样本对模型结构：嵌入层→RNN层→全连接层训练过程：重点理解CrossEntropyLoss的维度要求和损失计算生成过程：逐字采样生成新文本。

#rnn #人工智能 #深度学习

一文搞懂Flink乱序数据 + Watermark

乱序数据产生的核心原因：司机端网络波动（高速、偏远地区）、设备缓存、数据传输链路延迟，是货运平台的常态；用少量的实时性牺牲（5秒），换取数据统计的准确性，让基于「司机真实点击时间」的事件时间统计有实际意义；容忍度设置原则：货运平台一般设置5-30秒，太短会丢失大量乱序数据，太长会导致统计结果延迟，需根据实际的网络延迟情况调整；最终效果：让每个司机的点击数据，都能被划入真实点击时间所属的5分钟窗口，

#flink #大数据

告别失忆 AI：LangChain RAG + 对话记忆实战，从 0 到 1 落地

本文介绍如何使用LangChain框架搭建一个本地文档智能问答系统，支持RAG检索和对话记忆功能。系统能读取TXT/DOCX/PDF等本地文档，通过向量化检索实现精准问答，并利用对话记忆实现连贯的多轮交互。文章详细讲解了RAG和对话记忆的技术原理，提供了完整的环境配置和Python实现代码，展示了系统能记住用户修改的信息并准确回答问题的效果。该系统适用于企业知识库、学习资料答疑等需要处理私有文档的

#人工智能 #深度学习

spark分布式运行xgboost

spark分布式运行xgboost数据集如下所示程序完整代码# coding=UTF-8import osos.environ['PYSPARK_SUBMIT_ARGS'] = '--jars /data/pycharm/zhanglong/pysparkxgboostnew/xgboost4j-spark-0.90.jar,/data/pycharm/zhanglong/pysparkxgboo

#大数据

Qwen3大模型 SFT+DPO 全流程调优与部署

在大模型落地应用中，基于基座模型的指令微调（SFT）和直接偏好优化（DPO）是提升模型效果的核心环节。本文以 Qwen3-4B-Instruct-2507 模型为例，完整梳理从基座模型启动、SFT 微调、模型融合到 DPO 调优及最终部署的全流程命令，适配昇腾环境，可直接复用。

#人工智能

到底了