logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Jupyter 介绍

大模型(通义千问、豆包、DeepSeek),很多训练、测试、调试都是在 Jupyter 里做的。就是一个能在浏览器里写代码、跑代码、看结果、写文字、画图表的 “在线草稿本”,● ✅ 代码 + 文字说明 + 公式 + 图片 + 图表 混在一起,像实验报告。● ✅ 方便分享:保存成 .ipynb 文件,发给别人就能直接运行。● ✅ 写 Python 代码,写一行跑一行,结果直接显示在下面。● ✅ 做数

#jupyter#ide#python
Deepseek 的创新及计算速度快和成本低的原因

Deepseek 的创新 开源模型MLA :通过低秩健值联合压缩的注意力机制。显著减小kv缓存的同时提高计算效率。MOE:Deepseek-MoE V3使用了61个MoE( Mix of Expert 混合专家)block,虽然总参数量很大,但每次训练或推理时只激活了很少的链路,训练成本大大降低,推理速度显著提高。 MoE 类比医院的分诊台,在过去所有病人都要找全科医生,效率低。混合精度框架 使用

#DeepSeek#语言模型#AI
dashscope 介绍及使用(调用阿里云 AI 大模型的核心工具)

【代码】dashscope 介绍及使用(调用阿里云 AI 大模型的核心工具)

#语言模型#AI
ModelScope和DashScope对比

上面两个都是阿里的 但是分工不同。

文章图片
#语言模型
Function Call与Fine-Tuning深度解析:核心原理、实战场景与本质区别

Function Call 是大模型的外部工具调用能力,核心逻辑是不修改大模型本身的任何参数与能力,仅让模型根据用户需求,自主识别并调用外部工具、接口、插件,弥补大模型原生能力的短板。大模型原生擅长自然语言理解、逻辑推理、内容生成,但存在天然短板:无法获取实时数据、不擅长精准计算、无法操作本地文件/表格、不能联网查询、无法对接第三方业务系统。而 Function Call 就是为了解决这类“模型不

文章图片
Function Call与Fine-Tuning深度解析:核心原理、实战场景与本质区别

Function Call 是大模型的外部工具调用能力,核心逻辑是不修改大模型本身的任何参数与能力,仅让模型根据用户需求,自主识别并调用外部工具、接口、插件,弥补大模型原生能力的短板。大模型原生擅长自然语言理解、逻辑推理、内容生成,但存在天然短板:无法获取实时数据、不擅长精准计算、无法操作本地文件/表格、不能联网查询、无法对接第三方业务系统。而 Function Call 就是为了解决这类“模型不

文章图片
AI 智能体完整分类详解:三大主流 Agent 架构

也被称作直觉型智能体,依靠实时环境信息与预设规则快速做出决策,没有独立内部思维模型,不做长远规划,只根据当下状态立刻做出行为反馈。属于思考规划型智能体,内置完整环境认知模型,具备独立推理、预判、方案推演能力,围绕长期既定目标制定分步执行计划,属于高阶智能体形态。整合反应式智能体极速响应与深思熟虑智能体全局规划两大核心优势,通过分层架构 + 调度仲裁机制,实现极速应急处理 + 长期战略规划双向兼顾,

#人工智能#架构
AI 智能体完整分类详解:三大主流 Agent 架构

也被称作直觉型智能体,依靠实时环境信息与预设规则快速做出决策,没有独立内部思维模型,不做长远规划,只根据当下状态立刻做出行为反馈。属于思考规划型智能体,内置完整环境认知模型,具备独立推理、预判、方案推演能力,围绕长期既定目标制定分步执行计划,属于高阶智能体形态。整合反应式智能体极速响应与深思熟虑智能体全局规划两大核心优势,通过分层架构 + 调度仲裁机制,实现极速应急处理 + 长期战略规划双向兼顾,

#人工智能#架构
react-router 源码之matchPath方法

【代码】react-router 源码之matchPath方法。

文章图片
#react.js#javascript#前端
    共 11 条
  • 1
  • 2
  • 请选择