CodeFuse 个人主页

@CodeFuse

CodeFuse

2024-01-02 11:29:37 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

ACL 2025 | GALLa：用图结构增强代码大模型，让代码理解更精准！

与以上三类方法不同，GALLa 借鉴了 NLP 与计算机视觉中现有的多模态对齐技术，通过图模态编码器+适配器+大语言模型级联的方式将代码结构图引入大模型的微调过程中，既能处理复杂的带环图结构，又保持了大语言模型原有结构的完整性。我们创新性地通过图神经网络（GNN）与跨模态对齐技术，将这些代码结构信息在微调阶段以迁移学习的方式注入大语言模型，既提升了模型的代码理解能力，又不改变模型的原始架构，成为一

#人工智能 #开源 #github

2024年7月117篇代码大模型论文最全整理

干货满满~

#大数据 #人工智能 #开源

新时代的程序员，已经在用大模型写代码了

咔哒”，“咔哒”。悟鸣在键盘上输入一个关键词，后面马上自动浮现出他接下来要输入的代码。他快速地扫了一眼，感觉没什么问题，按下“Tab”键，代码从灰色变成正常，代表这些代码被采纳，成为他所编写代码的一部分。这是他近段时间写代码的常见场景。自动浮现出的代码来自于 AI 的预测，而这种神奇的能力，就来自于近来越来越火的生成式 AI（AIGC），只不过他所用的智能工具，属于程序员专用，是 AIGC 在研发

#语言模型

对话蚂蚁开源蒋炜：让 Agent 把运维人员从 24 小时的待命中解放出来

在大模型出现之前，模型技术主要解决时序、日志、拓扑等结构化或半结构化数据的智能分析。但对于人类而言，更擅长的是语言沟通、文字记录、代码编写等非结构化数据处理。在大模型出现前，像。

#开源 #运维 #人工智能 +2

DevOps-Model：面向DevOps领域的大语言模型现已开源

DevOps-Model 是蚂蚁集团联合北京大学发布面向中文 DevOps 领域的大语言模型，通过收集 DevOps 领域相关的专业数据，再针对模型进行语言模型的加训和对齐训练，产出可以帮助工程师在整个开发运维生命周期提效的大模型。弥补当前大模型在 DevOps 领域的缺失，旨在做到有问题，问 DevOps-Model!当前我们已经开源了 7B 和 14B 两种规格的经过加训得 Base 模型和经

#devops #语言模型 #开源

DevOps-Eval：蚂蚁集团联合北京大学发布首个面向DevOps领域的大语言模型评测基准！

其中，dev数据集包含5个带有标签和解析的样例，用于few-shot评测；日志中包含了"Cannot open channel to <*> at election address /<*>:<*>"和"******* GOODBYE /<*>:<*> ********"这两个固定的模板片段，它们都在选项D中出现了。如下图所示，5-shot的结果要稍好于0-shot，其中DevOpsPal-14B

#devops #语言模型 #运维

2024年6月118篇代码大模型论文最全整理

代码大模型相关论文，干货满满~

#人工智能 #AIGC #大数据

新时代的程序员，已经在用大模型写代码了

#语言模型

CodeFuseEval : 代码类大模型多任务评估基准

代码领域作为自然语言大模型的一个垂类，除去NLP通用的一些技术能力评估、模型认知评估和安全可信评估外，对编码领域自身，需针对性评估模型自身在技术能力层面的表现，如不同类型代码生成能力、上下文或计算机知识的理解能力，以及在对外服务能力层面的表现，如服务体验、稳定性、开放性等。附：编码垂类评估内容示意图如下图，针对代码生成类和理解类的2个效果截图示例（代码补全和添加注释），在这2大类下会有一些技术能力

#人工智能

2024年5月90篇代码大模型论文最全整理

本文整理了 2024 年 5 月发布的 90 篇代码大模型相关论文，其中包括 17 篇发表在今年 ICLR 的论文

#人工智能 #开源

共 38 条

请选择