logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大型语言模型幻觉检测相关综述_0721

代码摘要中的幻觉检测面临一项重要挑战,即编程语言与自然语言之间复杂的交互关系。随着大型语言模型(LLMs)在理解这两个领域的任务中变得越来越熟练,它们的输出往往容易出现幻觉——即生成的摘要偏离实际代码逻辑或引入虚假信息。这一问题尤为复杂,因为它涉及双重任务:准确解读代码的技术语义,同时将其清晰地表达为自然语言。这一挑战进一步加剧的原因在于LLMs可能会根据标识符名称错误地解释代码实体,或者缺乏对特

#语言模型#人工智能#算法
豆包·图像创作模型 Seedream 4.0 实测:多图融合黑科技,4K生图秒级完成!

整体来说,Seedream 4.0 确实是个不错的升级。特别是多图融合、主体一致性这些功能,解决了很多实际痛点。对个人用户来说,各种创意玩法挺有意思的,3D手办、表情包、换装这些都能玩得很开心。对企业用户来说,电商营销、设计预览这些场景确实很实用,能提高不少效率。特别值得一提的是,Seedream 4.0 已经在火山方舟全量上线,提供企业级API服务。通过火山方舟API调用,不仅能体验到最满血的4

文章图片
#人工智能
通义甩出王炸!首个全开源DeepResearch诞生,性能硬刚OpenAI!

通义DeepDeepResearch:开启开源 AI 研究智能体的新纪元。

文章图片
#开源
通义甩出王炸!首个全开源DeepResearch诞生,性能硬刚OpenAI!

通义DeepDeepResearch:开启开源 AI 研究智能体的新纪元。

文章图片
#开源
图神经网络01-基于Graph的机器学习简介

1 为什么需要GraphsGraphs(图)是用于描述和分析具有关系/互动的实体的通用语言因为图论以及Graph充斥在我们学习和生活的方方面面:Event Graphs:事件图谱,比如我们常见的飞机航班图,从登机到我们安全抵达目的地,其中航班飞机与乘客之间发生了许多事情。Computer Networks:计算机网络拓扑图,在万维网中人们通过各种形式正在冲浪,云服务器、中转机、...

#神经网络#大数据#机器学习 +2
图神经网络11-GCN落地的必读论文:GraphSAGE

1 GraphSAGE论文简介论文:Inductive Representation Learning on Large Graphs在大图上的归纳表示学习链接:https://arxiv.org/abs/1706.02216作者:Hamilton, William L. and Ying, Rex and Leskovec, Jure(斯坦福)来源:NIPS 2017代码:https://git

#深度学习#自然语言处理#机器学习 +2
实体识别(2) -命名实体识别实践CRF

完整代码 https://www.heywhale.com/home/competition/6216f74572960d0017d5e691/content/条件随机场-CRFCRF,英文全称为Conditional Random Field, 中文名为条件随机场,是给定一组输入随机变量条件下另一组输出随机变量的条件概率分布模型,其特点是假设输出随机变量构成马尔可夫(Markov)随机场...

#算法#python#机器学习 +2
分享一篇非常有意思的文章:是否有必要训练大模型?

模型不再是智能的衡量标准,而是生产力的要素。我们应该用TFP来衡量,同时考虑产出率、推理定价等因素。我们正在看软件吃掉世界,模型开始蚕食劳动力市场。能活下来的公司将是那些能以最高ROI把Token高效转化成劳动力的公司。

文章图片
#人工智能
分享一篇非常有意思的文章:是否有必要训练大模型?

模型不再是智能的衡量标准,而是生产力的要素。我们应该用TFP来衡量,同时考虑产出率、推理定价等因素。我们正在看软件吃掉世界,模型开始蚕食劳动力市场。能活下来的公司将是那些能以最高ROI把Token高效转化成劳动力的公司。

文章图片
#人工智能
【无标题】

Qwen 3-Next 系列的发布标志着稀疏模型技术的重要进展。通过将激活比例降至史无前例的低水平,同时保持强大的性能表现,这一创新为 AI 模型的部署和应用开辟了新的可能性。对于开发者和研究人员而言,Qwen 3-Next 提供了在有限硬件资源下运行大规模模型的现实方案。随着 llama.cpp 等推理框架对新架构的支持逐步完善,这类稀疏模型有望在移动设备和边缘计算场景中发挥更大作用。阿里巴巴表

文章图片
#人工智能
    共 106 条
  • 1
  • 2
  • 3
  • 11
  • 请选择