logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

单卡4090微调大模型 DeepSeek-R1-32B

上篇文章的微调结果并不好,因为设置了max_steps=60 限制了只执行60步以便快速完成实验。之前文章同样的方法,也可以在 24G 显存的单卡 4090 上微调训练 deepseek-ai/DeepSeek-R1-Distill-Qwen-32B;即使该模型的权重文件大小已经达到 62G,这是因为 unsloth 和 lora 的量化微调和部分参数微调优化可以大幅节约显存占用。最近,我们又陆续

文章图片
#算法#transformer#深度学习
上海人工智能实验室大模型算法岗,竞争太激烈了。。。

当前职场竞争激烈,求职者增多而岗位减少,要求也更高。为帮助求职者应对技术面试,我们整理了大厂面试题并发布《大模型面试宝典》(2025版)。上海人工智能实验室实习岗位竞争尤为激烈,HR反馈投递人数众多。无论是实习还是正式工作,提前准备至关重要。面试内容涵盖自我介绍、项目经验、技术问题及算法题,涉及大模型训练、微调、推理加速等。建议求职者尽早准备,以提升获得心仪offer的机会。

文章图片
#人工智能#算法#面试 +2
【面经】面试京东大模型算法岗,被狠狠拷打啊。。。。

最近春招和实习已开启了。不同以往的是,当前职场环境已不再是那个双向奔赴时代了。求职者在变多,HC 在变少,岗位要求还更高了。最近,我们又陆续整理了很多大厂的面试题,帮助一些球友解惑答疑,分享技术面试中的那些弯弯绕绕。。今天分享一些京东算法岗一面面经。

文章图片
#面试#算法#职场和发展 +2
单卡4090微调大模型 DeepSeek-R1-32B

上篇文章的微调结果并不好,因为设置了max_steps=60 限制了只执行60步以便快速完成实验。之前文章同样的方法,也可以在 24G 显存的单卡 4090 上微调训练 deepseek-ai/DeepSeek-R1-Distill-Qwen-32B;即使该模型的权重文件大小已经达到 62G,这是因为 unsloth 和 lora 的量化微调和部分参数微调优化可以大幅节约显存占用。最近,我们又陆续

文章图片
#算法#transformer#深度学习
手把手教你基于Ollama+FastGPT+Deepseek,打造个人知识库!

最近春招和实习已开启了。不同以往的是,当前职场环境已不再是那个双向奔赴时代了。求职者在变多,HC 在变少,岗位要求还更高了。最近,我们又陆续整理了很多大厂的面试题,帮助一些球友解惑答疑,分享技术面试中的那些弯弯绕绕。。本文从零实现,基于Ollama、FastGPT、Deepseek在本地环境中打造属于自己的专业知识库,与大家分享~

文章图片
#面试#人工智能#自然语言处理
我用 DeepSeek 制作了一个课堂点名系统

是时候准备春招和实习了。节前,我们邀请了一些互联网大厂朋友、今年参加社招和校招面试的同学。针对新手如何入门算法岗、该如何准备面试攻略、面试常考点、大模型技术趋势、算法项目落地经验分享等热门话题进行了深入的讨论。不知道有没有老师朋友们在上课点名的时候,出现叫错名的尴尬场景。没有点名册的时候,依稀只能想起那印象深刻的两三个学生名字。现在有了deepseek,你们敢信吗,我花就做出来了课堂随机抽问的网页

文章图片
#人工智能#深度学习#算法
用 DeepSeek 打造你的超强代码助手

最近已有不少大厂停止秋招宣讲,准备计划准备春招吧。节前,我们邀请了一些互联网大厂朋友、今年参加社招和校招面试的同学。针对新手如何入门算法岗、该如何准备面试攻略、面试常考点、大模型技术趋势、算法项目落地经验分享等热门话题进行了深入的讨论。大家好,今天我想给你们介绍一个我最近发现的工具,叫。它是一个专门为开发者打造的代码助手应用,可以帮你读文件、改文件,甚至生成代码。更厉害的是,它完全基于,能实时生成

文章图片
#人工智能#开源#算法 +1
用 Ollama + DeepSeek + Dify ,搭建本地知识库!!!

1. Dify:AI 应用开发平台Dify 是一个开源的 LLM(大语言模型)应用开发平台,功能超强大。它支持自定义 AI 工作流,能实现复杂任务自动化;还有 RAG 管道,通过检索增强生成技术,让文档检索和问答超准;多种主流 LLM 模型都能集成管理,还提供丰富的日志和监控功能。Dify 的架构也很清晰,分为模型层、数据处理层、应用层和管理层,能满足各种需求。2. DeepSeek:国产大模型的

文章图片
#面试#职场和发展#人工智能 +1
清华大学DeepSeek使用手册,长达104页!(附PPT下载)

从避免AI幻觉的小窍门,到设计出色提示语的秘籍,每一页都凝聚着干货知识,让用户能够直接上手操作,快速掌握DeepSeek的精髓。这份文档不仅为用户提供了关于DeepSeek的全面知识,还体现了中国科技在人工智能领域的快速发展。《DeepSeek:从入门到精通》以通俗易懂的方式,全面介绍了DeepSeek的使用方法,为用户提供了极具价值的指导。这份文档内容丰富,篇幅长达104页,涵盖了众多实用技巧。

文章图片
#python#人工智能#开发语言 +1
大模型 DeepSeek-r1 本地部署如何开启联网搜索?

Page Assist 是一款开源浏览器扩展,旨在为您的本地 AI 模型提供侧边栏和 Web UI。通过它,您可以从任何网页与您的模型进行互动。当前功能: - 用于各种任务的侧边栏 - 支持视觉模型 - 本地 AI 模型的极简 Web UI - 互联网搜索 - 在侧边栏上使用 PDF 聊天 - 与文档聊天(pdf、csv、txt、md、docx)二、安装方法Chrome 谷歌浏览器在线方法直接打开

文章图片
#人工智能#深度学习#算法
    共 84 条
  • 1
  • 2
  • 3
  • 9
  • 请选择