Python算法实战个人主页

@2301_78285120

Python算法实战

2024-01-18 16:45:33 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

通用大模型训练过程必须经历的四个阶段！

以上4个阶段构成了完整的GPT模型训练的pipeline，从中可以看出训练大模型是一个非常艰巨的任务，例如对庞大算力资源的要求、对高质量语料数据的要求。另外，在训练大模型的时候一般需要基于一些优化框架，如DeepSpeed，这些工程化方面的任务也有不少坑。因此，对于一般的企业而言通常不建议自己训练基础大模型，如果必须进行私有化部署，可以根据实际情况选择一款开源大模型，如有必要可基于开源大模型进行微

#人工智能 #大数据

【大模型】开源向量数据库性能对比: Milvus, Chroma, Qdrant

Qdrant：优点：中规中矩，Qps 相对较高、延迟相对较低。在CPU和磁盘IO方面的利用率较高，能够在处理高负载时提供较好的性能。缺点：在大数据集的加载时间和总体检索精度上略逊于 Milvus，适合对过滤查询有需求但不追求极端性能的场景。对CPU和内存的需求较大，尤其在高并发和复杂查询时可能会出现较高的资源消耗，导致系统负载上升。Chroma：优点：对于较小的数据集，Chroma 更容易上手和集

#开源 #数据库 #milvus +3

字节大模型岗面试：BF16为什么比FP16更适合大模型训练？

随着DeepSeek爆火，面试中也越来越高频出现，因此训练营也更新了DeepSeek系列技术的深入拆解。包括MLA、MTP、专家负载均衡、FP8混合精度训练，Dual-Pipe等关键技术，力求做到全网最硬核的解析~本篇文章主要对训练 LLM 以及部署应用时的精度问题进行了一些探讨和实践，读过后应该会对常用的浮点数 FP16，FP32，BF16 有一个更好的理解~

#面试 #职场和发展 #算法 +2

GraphRAG+Ollama，构建本地精准大模型问答系统

最近已有不少大厂都在秋招宣讲了，也有一些在 Offer 发放阶段。节前，我们邀请了一些互联网大厂朋友、今年参加社招和校招面试的同学。针对新手如何入门算法岗、该如何准备面试攻略、面试常考点、大模型技术趋势、算法项目落地经验分享等热门话题进行了深入的讨论。RAG 是目前大语言模型相关最知名的工具之一，从外部知识库中检索事实，以便为大型语言模型 (LLM) 提供最准确、最新的信息。但 RAG 并不完美，

#经验分享 #算法 #人工智能 +1

大模型为什么都倾向于decoder-only？

T5 Scale up 到 100B、500B 的难度很大，训练成本的增加远远高于 GPT。因此也许 100B 的 T5 训练 10T tokens 的模型能力比 100B 的 GPT 更强，但为此要支付的算力/时间成本远大于 100B GPT 训练 10T tokens。以至于：没有公司愿意支付这样的代价我还不如支付相同的代价，让 GPT 多训练更多倍的 Tokens；或者训练一个参数量大很多的

#面试 #transformer #深度学习 +2

百川智能大模型面试题：PPO & GRPO 原理及区别是什么？

通过这个小学考试的比喻，我们逐步从只看绝对分数的朴素思路，演化到 PPO 的完整机制（Critic、Advantage、Clip、Reference Model），再到GRPO的创新思路（用一组输出的平均得分当基线，省去价值函数的繁琐）。以下几点值得再次强调：Critic 的意义：它为每个状态或阶段提供“合理预期”，大幅降低了训练方差；Clip & min 机制：约束策略更新幅度，避免一次考试“爆

#面试 #算法 #人工智能

Python态势感知系统（附源码）

适配linux，且由于作者水平有限，中间件只支持apache，确保linux用户权限为root，且安装有iptables防火墙命令（不需要告警可忽略iptables）数据库密码默认设置为root/123456789，后台默认初始密码为：admin/123456，apache日志为默认路径。如果不需要告警可忽略，需要告警请自行配置config.py里的邮箱和密码（ps: 这里的密码是邮箱授权码）如需

#python #flask #开发语言

字节大模型岗面试：BF16为什么比FP16更适合大模型训练？

#面试 #职场和发展 #算法 +2

小白学大模型 RAG：9种不同的Chunk划分方法

最近已有不少大厂已停止秋招宣讲了。节前，我们邀请了一些互联网大厂朋友、今年参加社招和校招面试的同学。针对新手如何入门算法岗、该如何准备面试攻略、面试常考点、大模型技术趋势、算法项目落地经验分享等热门话题进行了深入的讨论。在RAG（Retrieval Augmented Generation）技术中，划分chunk是将长文档或数据集切割成较小的、独立的部分，以便于处理、存储和检索。

#人工智能 #深度学习 #算法

面试美团大模型算法岗，问的贼细。。。

最近这一两周看到不少互联网公司都已经开始秋招提前批了。不同以往的是，当前职场环境已不再是那个双向奔赴时代了。求职者在变多，HC 在变少，岗位要求还更高了。最近，我们又陆续整理了很多大厂的面试题，帮助一些球友解惑答疑，分享技术面试中的那些弯弯绕绕。

#面试 #算法 #职场和发展 +2

共 93 条

请选择