狂敲代码的猴先生个人主页

狂敲代码的猴先生

2024-02-26 23:38:15 加入 DevPress

简介

该用户还未填写简介

未填写擅长的技术栈

暂无可提供的服务

大模型虽具备卓越的理解、生成与推理能力，但仅靠内部运行或用户指令，难以充分施展其强大潜力。本报告介绍一种模型上下文协议（MCP），以标准化的方式连接大模型与外部工具、数据源等，实现高效、灵活的大模型应用扩展。

大语言模型的强大能力和广泛应用引发了大量的相关研究，尤其是其在安全和隐私方面所带来的问题。本报告以 2024 年发表在《High-Confidence Computing》期刊上的一篇综述论文为核心，介绍大语言模型安全和隐私研究概况。

大规模的神经网络模型需要依托分布式集群环境完成载入和训练。技术演进不仅让模型规模膨胀，支撑算力的硬件也迭代升级，如何充分利用异构算力将成为难题。调研分享在异构集群下并行训练的近期研究。

仅依靠大语言模型去辅助工作效果并不理想，结合领域相关知识或许能更有效。分享一篇即将要发表于 2025 年 ICSE 会议的论文 CKGFuzzer，它通过结合代码知识图谱，让大语言模型可以更加高效且准确地生成模糊驱动器。

大模型训练与推理涉及庞大的参数规模和数据量，若无法在模型设计和执行之前预估时间成本，可能带来巨大损失。分享 PyTorch 深度学习框架中的性能分析器 Profiler，探讨其在模型性能分析中的作用和价值。

一般来说，综述是一个创新性不高但工作量极大的任务，要归纳整理概括全面展望未来，然本质上并没有研究出新方法。分享一篇发表于2024年JNCA期刊的论文，它将综述卷出了新高度，聚焦人工智能和区块链技术，综述了两种技术交叉应用的综述。

大语言模型是当前人工智能领域的前沿研究方向，在安全性方面大语言模型存在一些挑战和问题。分享一篇发表于2024年ICASSP会议的论文FuzzLLM，它设计了一种模糊测试框架，利用模型的能力去测试模型对越狱攻击的防护水平。

大语言模型是当前最受关注的研究热点，基于其生成和理解能力，对现有领域在提升性能和效果上做更多尝试。分享一篇发表于2024年ICSE会议的论文Fuzz4All，它组合多个大语言模型以非常轻量且黑盒的方式，实现了一种跨语言和软件的通用模糊测试。

共 14 条

请选择