logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Blaze:快手自研 Spark 向量化引擎从生产实践到社区开源

导读大家好,我是快手数据平台部的张力,有着十多年的数据架构和数据平台研发经验。也曾在一些大厂,如百度、滴滴、蚂蚁就职过。今天我要给大家分享的是 Spark 向量化技术引擎——Blaze。目前 Blaze 已经在快手大规模地投入生产了。最近我们也在做关于 Blaze 的社区运营,欢迎大家关注和加入。接下来的分享主要由下面六个部分组成:1.关于向量化的介绍2.Apache Spark 与向量化3...

#spark#大数据#分布式
AI Coding与单元测试的协同进化:从验证到驱动

目前,国内外很多AI Coding助手能在几秒钟内生成完整代码块,大大提升了开发效率,但这种高速开发模式也带来了潜在风险——与人工编码不同是,AI Coding助手生成代码存在两个特殊风险:其一,AI Coding助手依赖于上下文与模型自身的能力,输出的代码质量相对不可控。更深层次的变化在于,我们正在重新定义开发者的核心价值:当我们从“思考提示词”转向“思考测试用例”,本质上是从AI代码被动的审查

#人工智能#单元测试
claude code有趣的思考提示词

拟人化、幽默甚至有点“神经质”**的单词,可以让用户感觉到 AI 是一个“活生生”的同事,它有时在“施法 (Conjuring)”,有时在“慢炖 (Marinating)”,有时在“费力搬运 (Schlepping)”,从而降低等待的焦虑感。它们本质上是硬编码在客户端的一个词库,用于缓解等待时的枯燥感,并赋予 AI 一种“正在努力思考”的拟人化性格。这些词通常出现在 Claude 处理复杂逻辑、分

马斯克、Claude之父、OpenAI三巨头:从同一桌饭局到AI圈最大撕逼大战

总的来说,这不是单纯的“谁对谁错”,而是 AI 发展路径的不同选择:是激进冲刺、谨慎把关,还是追求“最大真相”?(2023 年),推出 Grok,定位是“最大限度追求真相”(maximally truth-seeking),直接对标 ChatGPT 和 Claude,宣称要对抗“woke AI”。他玩梗说公司名“Anthropic”(亲人类)注定会变成“Misanthropic”(厌人类),因为

#人工智能
被 ARCoder 拿捏了!多模畅聊 + 个性定制,超绝

浪尖的小程序 ARCoder 迎来重大升级!如今,它成功接入了豆包、kimi、千问 deepseek 等多款热门大模型,尤其是对 deepseek 的使用体验进行了全面优化,现在用户可以尽情畅聊,无需担忧交流阻碍。ARCoder 的强大不止于此,它还能精准记忆用户习惯,在对话过程中完美记忆上下文,让交流更加自然流畅。同时,用户更能根据自己的喜好定义专属 AI 角色,创建个性化的 AI 智能体,无论

解惑|很多人对spark内存调优不太理解的配置

今天,星球里有个妹子问了一个问题,问题出自前面的一篇文章:spark 内存,GC及数据结构调优其中有段话2),在gc的统计信息中,如果老年代接近满了,减少用于缓存的内...

何为大数据分析?

大数据的分析从所周知,大数据已经不简简单单是数据大的事实了,而最重要的现实是对大数据进行分析,只有通过分析才能获取很多智能的,深入的,有价值的信息。那么越来越多的应用涉及...

claude code有趣的思考提示词

拟人化、幽默甚至有点“神经质”**的单词,可以让用户感觉到 AI 是一个“活生生”的同事,它有时在“施法 (Conjuring)”,有时在“慢炖 (Marinating)”,有时在“费力搬运 (Schlepping)”,从而降低等待的焦虑感。它们本质上是硬编码在客户端的一个词库,用于缓解等待时的枯燥感,并赋予 AI 一种“正在努力思考”的拟人化性格。这些词通常出现在 Claude 处理复杂逻辑、分

数据治理之元数据管理的利器——Atlas入门实战宝典(万字长文)

来源:浪尖聊大数据随着数字化转型的工作推进,数据治理的工作已经被越来越多的公司提上了日程。作为Hadoop生态最紧密的元数据管理与发现工具,Atlas在其中扮演着重要的位置。但是其官方文档不是很丰富,也不够详细。所以整理了这份文档供大家学习使用。本文档基于Atlas2.1.0版本,整理自部分官网内容,各种博客及实践过程。文章较长,建议收藏。本文档共分为8个部分,层级结构如下图所示。文档版权为公众号

基于Hive数据仓库的标签画像实战!

来源:凹凸数据全文共3780个字,建议阅读需8分钟Hive数据仓库建立用户画像首先需要建立数据仓库,用于存储用户标签数据。Hive是基于Hadoop的数据仓库工具,依赖于HDFS存储数据,提供的SQL语言可以查询存储在HDFS中的数据。开发时一般使用Hive作为数据仓库,存储标签和用户特征库等相关数据。"数据仓库之父" W.H.Inmon 在《Building the Data Wareh...

#数据仓库#hive#hadoop +1
    共 91 条
  • 1
  • 2
  • 3
  • 10
  • 请选择