logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大幅降低数据科学门槛!豆包大模型团队开源AutoKaggle,端到端解决数据处理

字节跳动豆包大模型团队与 M-A-P 社区于近日提出 AutoKaggle ,为数据科学家提供了一个端到端的数据处理解决方案,帮助简化和优化日常数据科学工作流程的同时,极大降低数据科学的门槛,可帮助更多没有相关背景的使用者进行有价值的探索。最后,我们统计了不同错误类型及出现次数,可以看到,每个子任务阶段都有可能发生错误。未来,团队成员还将继续探索智数据科学课题及相关开源工作,并关注 Kaggle

文章图片
#开源#数据分析
首次覆盖超 11 类真实编程场景!豆包大模型团队开源代码大模型全新基准

字节跳动豆包大模型团队开源 FullStack Bench,一个专注于全栈编程和多语言编程的代码评估数据集。FullStack Bench 能够真实反映大模型在多种实际代码开发场景中的表现,有助于推动代码智能领域的进一步发展。

文章图片
#开源#人工智能#编程语言
字节跳动开源 Gödel Scheduler:在离线统一调度器

作为字节跳动在离线混部场景中最核心的调度系统,Gödel 提供丰富的资源 QoS 管理能力,可以统一调度在线和离线应用,极大提升资源利用率。

文章图片
#开源#云原生#kubernetes +1
字节跳动开放计算最佳实践,亮相 2024 开放计算中国峰会

8 月 8 日,由两大开放计算组织 OCP(Open Compute Project)与 OCTC(开放计算标准工作委员会)联合主办的主题为 “开放协同:协作、智慧、创新” 的 2024 开放计算中国峰会在北京举行,以期与全球开放计算领域的社区和企业领袖、技术专家以及行业先锋,共同探讨新时代开放计算技术的最新进展和实践经验,促进生态融合、智能化实践和技术创新。而随着人工智能、大模型的爆发,传统的计

文章图片
#开源#硬件工程#系统架构 +1
字节开放模型 Hyper-SD,最快 1 步生成 SOTA 级图片(有demo 来试试

论文提出了 Hyper-SD,一个统一的扩散模型加速框架,可以显著提升扩散模型的在低步数情况下的生成能力,实现基于 SDXL 和 SD15 的新 SOTA 性能。该方法通过采用轨迹分段一致性蒸馏,增强了蒸馏过程中的轨迹保存能力,实现接近原始模型的生成效果。然后,通过进一步利用人类反馈学习和变分分数蒸馏提升模型在极端低步数下的潜力,从而产生了更优化、更高效的模型生成效果。

文章图片
#计算机视觉#人工智能
FlowGram 简介:开源前端流程搭建引擎

FlowGram 是一套基于节点编辑的流程搭建引擎,帮助开发者快速创建固定布局或自由连线布局的流程,并提供一套交互的最佳实践, 很适合有明确输入和输出的可视化工作流。

文章图片
#前端
大幅降低数据科学门槛!豆包大模型团队开源AutoKaggle,端到端解决数据处理

字节跳动豆包大模型团队与 M-A-P 社区于近日提出 AutoKaggle ,为数据科学家提供了一个端到端的数据处理解决方案,帮助简化和优化日常数据科学工作流程的同时,极大降低数据科学的门槛,可帮助更多没有相关背景的使用者进行有价值的探索。最后,我们统计了不同错误类型及出现次数,可以看到,每个子任务阶段都有可能发生错误。未来,团队成员还将继续探索智数据科学课题及相关开源工作,并关注 Kaggle

文章图片
#开源#数据分析
MySQL遇到AI:字节跳动开源 MySQL 虚拟索引 VIDEX

虚拟索引技术在数据库系统的查询优化、索引推荐等场景中扮演着关键角色。简单来说,虚拟索引可以理解为数据库的'沙盘推演'系统——无需真实构建索引,仅基于统计信息即可精准模拟不同索引方案对查询计划的优化效果。由于虚拟索引的创建/删除代价极低,使用者可以大量创建和删除索引、反复推演,确定最有效的索引方案。在AI时代,基于机器学习模型的NDV、Cardinality 估计算法层出不穷,但是在MySQL落地往

文章图片
#mysql#人工智能#开源
首次覆盖超 11 类真实编程场景!豆包大模型团队开源代码大模型全新基准

字节跳动豆包大模型团队开源 FullStack Bench,一个专注于全栈编程和多语言编程的代码评估数据集。FullStack Bench 能够真实反映大模型在多种实际代码开发场景中的表现,有助于推动代码智能领域的进一步发展。

文章图片
#开源#人工智能#编程语言
大幅降低数据科学门槛!豆包大模型团队开源AutoKaggle,端到端解决数据处理

字节跳动豆包大模型团队与 M-A-P 社区于近日提出 AutoKaggle ,为数据科学家提供了一个端到端的数据处理解决方案,帮助简化和优化日常数据科学工作流程的同时,极大降低数据科学的门槛,可帮助更多没有相关背景的使用者进行有价值的探索。最后,我们统计了不同错误类型及出现次数,可以看到,每个子任务阶段都有可能发生错误。未来,团队成员还将继续探索智数据科学课题及相关开源工作,并关注 Kaggle

文章图片
#开源#数据分析
    共 17 条
  • 1
  • 2
  • 请选择