
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
EP 和 TP 各有优劣,其选择取决于具体的训练场景和需求:计算效率:EP 在 expert 的计算效率上具有优势,减少了 kernel launch 次数,增加了每次 launch 的 workload。通信开销:在 topk=2 且 token 分配均匀的情况下,EP 和 TP 的通信量相近。但在topk>2或分配不均匀的情况下,EP 的通信开销高于 TP。显存占用:TP 的显存占用更低且更稳

定义:RAG 通过在向 LLM 发送提示前检索并注入相关信息,减少失误,提升回答准确性。向量搜索:通过嵌入模型将文本转换为向量,基于余弦相似度匹配相关内容。混合搜索:结合向量搜索与关键词搜索(如 Azure AI Search 支持)。

接触各种AI工具到现在也快两年了,今年和同学陆续做了一些AI应用的科普宣讲,在这过程中收集了不少自学资源,特地挑出一部分整理成以下的内容。书籍大模型应用开发极简入门:基于GPT-4和ChatGPT首推今年年初出版的《大模型应用开发极简入门:基于GPT-4和ChatGPT》,小红书上也有人叫它“章鱼书”(实际上是刺蛇尾Ophiothrix spiculata)。这本书应该是目前综合下来最好的大模型应

大模型微调技术为AI应用提供了强大的定制化能力,使通用模型能够适应特定领域和任务需求。随着大模型广泛使用,使更多开发者能够创建自己的专业模型。无论是提升专业领域的回答质量,还是塑造特定的回答风格,微调都是一个强大而实用的工具。对于想要深入学习的读者,建议从小规模实验开始,逐步掌握数据准备、参数调整的技巧,最终构建满足特定需求的个性化大模型。

DeepSeek R1的诞生,不仅是技术的突破,更预示着人机协作的新纪元。当它走进千行百业,或许我们会发现:最惊艳的创新,往往始于对人类思维本质的深刻理解。

在人工智能(AI)迅速发展的背景下,传统编程领域的程序员改何去何从呢?2025年程序员可以转行去哪些地方呢?其实在现在AI时代对于传统的程序员来说是一个绝佳的实现职业转型、提升薪资待遇的机遇。那么对于考虑转行到大模型领域的程序员来说,有几个热门岗位是值得特别关注的。这些岗位不仅代表了当前技术发展的趋势,也提供了转型的广阔舞台和职业发展的新机遇。

继 Vibe Coding 火了之后,Andrej Karpathy 又带火了一个词——Context Engineering 翻译成中文就是:「上下文工程」**。。Andrej Karpathy 作为 AI 领域的标志性人物,他一直都很善于用贴近开发者直觉的语言,去定义一些复杂技术的核心变化趋势,比如 “Software 2.0”、 “Software 3.0”、“Vibe Coding”,还有

当然这样利用大模型去进行搜索query改写,虽然能够带来更丰富的搜索信息,但是性能上会受到损失,产品上的设计一定要考虑这一点。

为每个人提供最有价值的技术赋能」,2025年我们和赋范空间的小伙伴们一起来!发起的“Agentic 时代同行计划”会和我们的学员一起,分享自己的经历、经验,集结群体的智慧一起拥抱Agentic新时代!受访者:白衣人间客,本科非相关专业(文科)毕业,现就职大模型算法岗采访&整理:运营范范。

在ChatGPT掀起AI革命的今天,你是否想过亲手打造一个会思考的机器大脑?无需百万美元预算,从数据清洗到模型微调,从算力分配到参数调试,一口气搞定。








