
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
心法利器本栏目主要和大家一起讨论近期自己学习的心得和体会。具体介绍:仓颉专项:飞机大炮我都会,利器心法我还有。2023年新的文章合集已经发布,获取方式看这里:又添十万字-CS的陋室2023年文章合集来袭,更有历史文章合集,欢迎下载。往期回顾心法利器[106] 基础RAG-调优方案心法利器[107] onnx和tensorRT的bert加速方案记录心法利器[108] | 微调与RAG的优缺点分析心.
如果你最近在找一个靠谱的开源模型,不管是端侧还是云端,都可以去试试。也就是说,你现在能用开源Gemma 4直接做OCR、图片问答、音频转录了,不需要组合多个模型。:从 2B 手机端到 31B 服务器端,每个尺寸都给你准备好了,不像有些大厂只放出来大模型。谷歌刚刚发布了新一代开源大模型Gemma 4,直接把Gemini 3的核心技术下放了。• 美国这边:Gemma 4 扛起大旗,持续放货,开发者多了
“多大型多模态的评估标准MM-Vet 定义了 6 个核心 VL 功能:识别、OCR、知识、语言生成、空间感知和数学计算,并提出了一个基于 LLM 的开放式输出评估器,可以对不同的问题类型和答案风格进行评估,从而产生统一的评分指标。”01—目前大型多模态模型(LMM)展示了解决各种复杂任务的能力,为了评估在复杂多模态任务上的集成能力,新加坡国立大学 Weihao Yu、Xinchao Wang...
大家好,我是HxShine今天分享DeepSeek R1 ,Title: DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning:通过强化学习激励LLM的推理能力。这篇文章介绍了DeepSeek的第一代推理模型DeepSeek-R1-Zero和DeepSeek-R1。DeepSeek...
一、前言Transformer模型作为一种革命性的神经网络架构,于2017年由Vaswani等人 提出,并在诸多任务中取得了显著的成功。Transformer的核心思想是自注意力机制,通过全局建模和并行计算,极大地提高了模型对长距离依赖关系的建模能力。但是Transformer在处理长序列时面临内存和计算复杂度的问题,因为其复杂度与序列长度呈二次关系一直未业内人员所诟病。今天我们学习的RWKV,它
【点击】加入大模型技术交流群随着 ChatGPT 的现象级走红,引领了AI大模型时代的变革,从而导致 AI 算力日益紧缺。与此同时,中美贸易战以及美国对华进行AI芯片相关的制裁导致 AI 算力的国产化适配势在必行。之前对华为昇腾AI软硬件平台进行过相应的介绍,本文将讲述针对ChatGLM-6B大模型在昇腾910加速卡上面进行模型推理,具体代码放置在GitHub:https://github.com
【点击】加入大模型技术交流群随着 ChatGPT 的现象级走红,引领了AI大模型时代的变革,从而导致 AI 算力日益紧缺。与此同时,中美贸易战以及美国对华进行AI芯片相关的制裁导致 AI 算力的国产化适配势在必行。之前对华为昇腾AI软硬件平台进行过相应的介绍,本文将讲述针对ChatGLM-6B大模型在昇腾910加速卡上面进行模型推理,具体代码放置在GitHub:https://github.com
表格输出,不要开场白。量化策略那篇就是反面教材——第一次我只说"帮我测个策略",结果它给我跑了一个完全不是我想要的参数。它就自动帮我获取到了 2025 年 Hacker News 最受欢迎的科技博客订阅,覆盖领域:编程、技术、安全、AI、产品、创业、科研。同样一只虾,在一个懂得拆解任务、编写 Skill、设计反馈循环的人手里,和一个只会丢一句模糊指令的人手里,效果可能差十倍。它是一个功能丰富的技能
“人工智能的核心是算力。”01—需要多少预算?最近在学习大模型ChatGPT、ChatGLM,研究结合企业的应用场景,解决一些业务难点、痛点,不免涉及本地化部署、微调、训练、知识库文档数据提取等等方面的问题。同时还需要对硬件成本进行一个大致的估算:这个项目需要得用多少GPU?硬件采购的费用预算多少?要对硬件资源成本进行估算,一方面决定于项目的技术方案:是否需.
春节前,DeepSeek 发布了V3 和深度思考 R1版本,火出了圈。线上服务受到大规模恶意攻击,攻击手段复杂多样,包括暴力破解攻击和分布式拒绝服务攻击。整个过年期间,好多朋友在使用DS的官方App和网页的时候,多次遇到“服务器繁忙,请稍后重试”的错误提示。虽然这两天情况有所好转,但是我们有没有办法用上流畅的DS呢?既然 DeepSeek 系列大模型都是开源的,那不如换个思路,用算力资源部署的DS







