
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
上篇文章的微调结果并不好,因为设置了max_steps=60 限制了只执行60步以便快速完成实验。之前文章同样的方法,也可以在 24G 显存的单卡 4090 上微调训练 deepseek-ai/DeepSeek-R1-Distill-Qwen-32B;即使该模型的权重文件大小已经达到 62G,这是因为 unsloth 和 lora 的量化微调和部分参数微调优化可以大幅节约显存占用。最近,我们又陆续

当前职场竞争激烈,求职者增多而岗位减少,要求也更高。为帮助求职者应对技术面试,我们整理了大厂面试题并发布《大模型面试宝典》(2025版)。上海人工智能实验室实习岗位竞争尤为激烈,HR反馈投递人数众多。无论是实习还是正式工作,提前准备至关重要。面试内容涵盖自我介绍、项目经验、技术问题及算法题,涉及大模型训练、微调、推理加速等。建议求职者尽早准备,以提升获得心仪offer的机会。

最近春招和实习已开启了。不同以往的是,当前职场环境已不再是那个双向奔赴时代了。求职者在变多,HC 在变少,岗位要求还更高了。最近,我们又陆续整理了很多大厂的面试题,帮助一些球友解惑答疑,分享技术面试中的那些弯弯绕绕。。今天分享一些京东算法岗一面面经。

上篇文章的微调结果并不好,因为设置了max_steps=60 限制了只执行60步以便快速完成实验。之前文章同样的方法,也可以在 24G 显存的单卡 4090 上微调训练 deepseek-ai/DeepSeek-R1-Distill-Qwen-32B;即使该模型的权重文件大小已经达到 62G,这是因为 unsloth 和 lora 的量化微调和部分参数微调优化可以大幅节约显存占用。最近,我们又陆续

最近春招和实习已开启了。不同以往的是,当前职场环境已不再是那个双向奔赴时代了。求职者在变多,HC 在变少,岗位要求还更高了。最近,我们又陆续整理了很多大厂的面试题,帮助一些球友解惑答疑,分享技术面试中的那些弯弯绕绕。。本文从零实现,基于Ollama、FastGPT、Deepseek在本地环境中打造属于自己的专业知识库,与大家分享~

是时候准备春招和实习了。节前,我们邀请了一些互联网大厂朋友、今年参加社招和校招面试的同学。针对新手如何入门算法岗、该如何准备面试攻略、面试常考点、大模型技术趋势、算法项目落地经验分享等热门话题进行了深入的讨论。不知道有没有老师朋友们在上课点名的时候,出现叫错名的尴尬场景。没有点名册的时候,依稀只能想起那印象深刻的两三个学生名字。现在有了deepseek,你们敢信吗,我花就做出来了课堂随机抽问的网页

最近已有不少大厂停止秋招宣讲,准备计划准备春招吧。节前,我们邀请了一些互联网大厂朋友、今年参加社招和校招面试的同学。针对新手如何入门算法岗、该如何准备面试攻略、面试常考点、大模型技术趋势、算法项目落地经验分享等热门话题进行了深入的讨论。大家好,今天我想给你们介绍一个我最近发现的工具,叫。它是一个专门为开发者打造的代码助手应用,可以帮你读文件、改文件,甚至生成代码。更厉害的是,它完全基于,能实时生成

1. Dify:AI 应用开发平台Dify 是一个开源的 LLM(大语言模型)应用开发平台,功能超强大。它支持自定义 AI 工作流,能实现复杂任务自动化;还有 RAG 管道,通过检索增强生成技术,让文档检索和问答超准;多种主流 LLM 模型都能集成管理,还提供丰富的日志和监控功能。Dify 的架构也很清晰,分为模型层、数据处理层、应用层和管理层,能满足各种需求。2. DeepSeek:国产大模型的

从避免AI幻觉的小窍门,到设计出色提示语的秘籍,每一页都凝聚着干货知识,让用户能够直接上手操作,快速掌握DeepSeek的精髓。这份文档不仅为用户提供了关于DeepSeek的全面知识,还体现了中国科技在人工智能领域的快速发展。《DeepSeek:从入门到精通》以通俗易懂的方式,全面介绍了DeepSeek的使用方法,为用户提供了极具价值的指导。这份文档内容丰富,篇幅长达104页,涵盖了众多实用技巧。

Page Assist 是一款开源浏览器扩展,旨在为您的本地 AI 模型提供侧边栏和 Web UI。通过它,您可以从任何网页与您的模型进行互动。当前功能: - 用于各种任务的侧边栏 - 支持视觉模型 - 本地 AI 模型的极简 Web UI - 互联网搜索 - 在侧边栏上使用 PDF 聊天 - 与文档聊天(pdf、csv、txt、md、docx)二、安装方法Chrome 谷歌浏览器在线方法直接打开








