logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

AWQ:激活感知权重量化——让大语言模型更轻更快

AWQ代表了LLM量化领域的重要突破,其**"激活感知"思想不仅解决了量化误差的问题,更提供了一种硬件友好**的实现路径。荣获MLSys 2024最佳论文奖,证明了其在系统层面的创新价值。对于开发者而言,AWQ提供了一条务实的路径:在几乎不损失模型能力的前提下,将模型体积压缩至1/4,推理速度提升3倍,让大模型的普及门槛真正降低。参考资源代码:https://github.com/mit-han-

#语言模型#人工智能#自然语言处理
从Demo到可用:TodoWrite 幻觉问题优化指南

TodoWrite的原设计,核心是演示“AI如何调用工具、追踪进度”,追求简单直观,因此牺牲了稳健性;而优化的本质,是完成从“LLM托管状态”到“后端托管状态”的转变——让LLM专注于“做决策、发指令”,让后端专注于“管状态、做校验”。

#人工智能#大数据
gdal-linux-whl文件安装下载地址

网址:https://sourceforge.net/projects/gdal-wheels-for-linux/files/

文章图片
#学习
大模型的MCP和function calling的使用方式有什么区别

✅ 优点简单、可控易调试非常适合单体应用 / API 网关❌ 局限强耦合函数 schema 写死在 prompt / 请求里无发现能力模型只能用你“提前告诉它的函数”不适合跨进程、跨语言、跨服务。

#网络#服务器#运维
(Instruction LLMs)、(Reasoning LLMs)、多模态AIGC以及垂直领域应用经典奠基到前沿SOTA必读文献

这是目前(2024-2025)最火的方向,对标OpenAI o1,强调“慢思考”和复杂逻辑推理。医疗是容错率极低的领域,强调“上限探索”和“辅助诊疗”。负责指令遵循和人类对齐,这是目前大模型的基石。强调“细粒度可控”和“泛健康创意玩法”。

#AIGC
MCP案例 - 数据可视化工具服务器

【代码】MCP案例 - 数据可视化工具服务器。

文章图片
#信息可视化#服务器#运维
MCP案例 - 数据可视化客户端

【代码】MCP案例 - 数据可视化客户端。

文章图片
#信息可视化
大语言模型微调中的数据分布不均与长尾任务优化策略

在大语言模型(LLM)的生命周期中,监督微调(Supervised Fine-Tuning, SFT)是将预训练模型转化为能够遵循人类指令、具备特定领域专家知识的关键步骤。然而,微调阶段普遍面临的数据分布不均匀(Data Imbalance)问题已成为制约模型性能的瓶颈。这种不平衡不仅体现为传统分类任务中标签比例的失调,更深层次地表现为任务类型(如数学推理、创意写作、代码生成)、指令复杂度、语言覆

#人工智能#机器学习#深度学习
GitHub 相似仓库查找工具与项目

类别优点缺点推荐场景浏览器扩展易用、轻量覆盖有限,原理不透明个人浏览 GitHub 时快速找替代库语义搜索准确、可做自然语言检索构建成本较高RAG、知识库、技术调研依赖分析适合安全/供应链分析依赖数据不完整企业安全、生态分析GitHub API 方法开源、可扩展特征维度有限轻量项目、快速原型学术模型结构化强、代码级精准复杂度高科研、深度分析LLM + RAG解释性强、准确度高成本高企业内部推荐系统

#github
    共 22 条
  • 1
  • 2
  • 3
  • 请选择