logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

《实时特征工程:流式数据场景下的技术壁垒与应用竞争力》

◦ 流批一体特征处理:阿里巴巴Blink引擎支持实时特征与历史数据的无缝融合,在双11实时推荐中,动态生成“用户当前浏览品类与历史购买偏好的实时匹配度”特征,使推荐转化率提升25%;◦ 特征血缘实时追踪:工业物联网平台记录实时特征的数据流来源与变换逻辑,当设备故障报警时,可追溯至“传感器X的温度异常特征”触发,故障定位时间从30分钟缩短至5分钟。◦ 腾讯智服实时特征中台:整合流计算引擎、特征存储与

#机器学习
《特征工程自动化平台:企业级AI落地的效率护城河》

◦ 特征中台化管理:阿里巴巴的特征中台统一管理20万+特征,支持“特征血缘追溯-版本控制-权限管理”,某新品推荐项目借此复用80%的历史特征,开发效率提升60%;◦ 特征服务自动化部署:美团的特征平台支持特征计算逻辑一键部署为实时API,在配送预估中实现“特征计算-模型推理”的端到端自动化,响应延迟控制在50ms内。◦ 特征有效性实时监控:腾讯的特征平台每小时评估特征重要性,当发现“天气特征”在暴

#机器学习
《Jupyter Notebook远程服务器部署:打造多人协作机器学习开发环境》

通过远程部署Jupyter Notebook,可构建高效的机器学习协作开发环境,尤其适合团队共享GPU资源、集中管理数据的场景。掌握多人协作与权限管理技巧后,团队成员可在统一的开发环境中高效协作,大幅提升机器学习项目的开发效率。resource.setrlimit(resource.RLIMIT_DATA, (1024*1024*1024, -1))# 限制为1GB。• 协作开发:多人可同时访问同

#机器学习
数据不平衡难题:机器学习分类任务中正负样本失衡的处理全攻略

当数据不平衡时,多数类样本在损失计算中占据主导地位,模型为了降低整体损失,会优先学习多数类的特征模式,而对少数类样本的特征学习不足。数据不平衡是机器学习分类任务中不可忽视的难题,通过合理运用过采样、欠采样、代价敏感学习等多种策略,结合实际场景进行综合优化,能够有效提升模型对少数类样本的识别能力,提高模型的泛化性能,使机器学习模型在各类不平衡数据场景中发挥更大的价值。这种方法虽然能快速解决数据不平衡

#机器学习
《Jupyter Notebook远程服务器部署:打造多人协作机器学习开发环境》

通过远程部署Jupyter Notebook,可构建高效的机器学习协作开发环境,尤其适合团队共享GPU资源、集中管理数据的场景。掌握多人协作与权限管理技巧后,团队成员可在统一的开发环境中高效协作,大幅提升机器学习项目的开发效率。resource.setrlimit(resource.RLIMIT_DATA, (1024*1024*1024, -1))# 限制为1GB。• 协作开发:多人可同时访问同

#机器学习
    共 15 条
  • 1
  • 2
  • 请选择