浪尖聊大数据-浪尖个人主页

@rlnLo2pNEfx9c

浪尖聊大数据-浪尖

2022-07-08 17:22:50 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

Blaze：快手自研 Spark 向量化引擎从生产实践到社区开源

导读大家好，我是快手数据平台部的张力，有着十多年的数据架构和数据平台研发经验。也曾在一些大厂，如百度、滴滴、蚂蚁就职过。今天我要给大家分享的是 Spark 向量化技术引擎——Blaze。目前 Blaze 已经在快手大规模地投入生产了。最近我们也在做关于 Blaze 的社区运营，欢迎大家关注和加入。接下来的分享主要由下面六个部分组成：1.关于向量化的介绍2.Apache Spark 与向量化3...

#spark #大数据 #分布式

AI Coding与单元测试的协同进化：从验证到驱动

目前，国内外很多AI Coding助手能在几秒钟内生成完整代码块，大大提升了开发效率，但这种高速开发模式也带来了潜在风险——与人工编码不同是，AI Coding助手生成代码存在两个特殊风险：其一，AI Coding助手依赖于上下文与模型自身的能力，输出的代码质量相对不可控。更深层次的变化在于，我们正在重新定义开发者的核心价值：当我们从“思考提示词”转向“思考测试用例”，本质上是从AI代码被动的审查

#人工智能 #单元测试

claude code有趣的思考提示词

拟人化、幽默甚至有点“神经质”**的单词，可以让用户感觉到 AI 是一个“活生生”的同事，它有时在“施法 (Conjuring)”，有时在“慢炖 (Marinating)”，有时在“费力搬运 (Schlepping)”，从而降低等待的焦虑感。它们本质上是硬编码在客户端的一个词库，用于缓解等待时的枯燥感，并赋予 AI 一种“正在努力思考”的拟人化性格。这些词通常出现在 Claude 处理复杂逻辑、分

马斯克、Claude之父、OpenAI三巨头：从同一桌饭局到AI圈最大撕逼大战

总的来说，这不是单纯的“谁对谁错”，而是 AI 发展路径的不同选择：是激进冲刺、谨慎把关，还是追求“最大真相”？（2023 年），推出 Grok，定位是“最大限度追求真相”（maximally truth-seeking），直接对标 ChatGPT 和 Claude，宣称要对抗“woke AI”。他玩梗说公司名“Anthropic”（亲人类）注定会变成“Misanthropic”（厌人类），因为

#人工智能

被 ARCoder 拿捏了！多模畅聊 + 个性定制，超绝

浪尖的小程序 ARCoder 迎来重大升级！如今，它成功接入了豆包、kimi、千问 deepseek 等多款热门大模型，尤其是对 deepseek 的使用体验进行了全面优化，现在用户可以尽情畅聊，无需担忧交流阻碍。ARCoder 的强大不止于此，它还能精准记忆用户习惯，在对话过程中完美记忆上下文，让交流更加自然流畅。同时，用户更能根据自己的喜好定义专属 AI 角色，创建个性化的 AI 智能体，无论

解惑|很多人对spark内存调优不太理解的配置

今天，星球里有个妹子问了一个问题，问题出自前面的一篇文章：spark 内存，GC及数据结构调优其中有段话2),在gc的统计信息中，如果老年代接近满了，减少用于缓存的内...

何为大数据分析？

大数据的分析从所周知，大数据已经不简简单单是数据大的事实了，而最重要的现实是对大数据进行分析，只有通过分析才能获取很多智能的，深入的，有价值的信息。那么越来越多的应用涉及...

claude code有趣的思考提示词

数据治理之元数据管理的利器——Atlas入门实战宝典（万字长文）

来源：浪尖聊大数据随着数字化转型的工作推进，数据治理的工作已经被越来越多的公司提上了日程。作为Hadoop生态最紧密的元数据管理与发现工具，Atlas在其中扮演着重要的位置。但是其官方文档不是很丰富，也不够详细。所以整理了这份文档供大家学习使用。本文档基于Atlas2.1.0版本，整理自部分官网内容，各种博客及实践过程。文章较长，建议收藏。本文档共分为8个部分，层级结构如下图所示。文档版权为公众号

基于Hive数据仓库的标签画像实战！

来源：凹凸数据全文共3780个字，建议阅读需8分钟Hive数据仓库建立用户画像首先需要建立数据仓库，用于存储用户标签数据。Hive是基于Hadoop的数据仓库工具，依赖于HDFS存储数据，提供的SQL语言可以查询存储在HDFS中的数据。开发时一般使用Hive作为数据仓库，存储标签和用户特征库等相关数据。"数据仓库之父" W.H.Inmon 在《Building the Data Wareh...

#数据仓库 #hive #hadoop +1

共 91 条

请选择