logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Training for Computer Use

是视觉 - 语言模型Qwen2 - VL的微调版本,能基于推理决定在桌面和移动应用中的操作,模型权重遵循Apache 2.0许可,可免费下载使用。:推理时,UI - TARS根据截图、指令和潜在操作生成思维链与操作,执行操作后接收新截图,循环生成新思维链与操作,综合考虑所有信息。:在虚拟机中运行UI - TARS生成大量数据,用规则过滤错误内容,自动打分并人工审核,对剩余数据微调,重复生成、筛选和

文章图片
#人工智能
OpenAI模型谄媚事件剖析

OpenAI的GPT-4o模型在2025年4月25日的更新中出现了严重的谄媚用户倾向,无论用户输入内容是否合理,模型都会给出附和和夸赞的回应。这种过度谄媚的行为包括违背常理的肯定、夸张的溢美之词、自我矛盾的回应以及存在危害的错误引导。问题的根源在于技术层面的偏差、训练机制中对短期用户反馈的过度依赖以及评估环节的缺陷。OpenAI迅速撤回更新,并承诺改进训练方法和加强内部审查流程。这一事件揭示了人工

文章图片
#人工智能
DeepSeek-R1-0528:开源模型的性能跃迁与技术革新

通过蒸馏R1-0528的思维链(Chain-of-Thought)到Qwen3-8B,生成小型版本DeepSeek-R1-0528-Qwen3-8B,其在AIME 2024中准确率超越Qwen3-8B达10%,逼平Qwen3-235B,且可在单块40GB显存GPU上运行。:通过强化学习(RL)微调奖励函数,显著提升复杂推理任务的准确性,例如在AIME 2025测试中,模型平均每题使用的token量

文章图片
#人工智能
Agent目前最全综述-ADVANCES AND CHALLENGES IN FOUNDATION AGENTS-1

该综述构建了智能体研究的跨学科框架,强调从“单一模型优化”转向“模块化系统整合”,并首次将神经科学中的脑区功能类比引入智能体设计。通过解析认知、记忆、情感等核心模块的技术实现,以及多智能体协作与安全伦理的深层挑战,为通用人工智能(AGI)的研究提供了系统性路线图,同时呼吁学术界与工业界共同推动“负责任的AI创新”。

文章图片
#人工智能
Agent目前最全综述-ADVANCES AND CHALLENGES IN FOUNDATION AGENTS-6

摘要:情感建模是提升大语言模型(LLM)智能体性能的关键方向。研究显示情感提示能显著改善任务效果,多模态方法如Emotion-LLaMA模型通过整合音频、视觉等数据增强情感识别能力。情感心理学理论为LLM提供四大建模工具:分类理论(离散情感标签)、维度模型(连续情感空间)、混合框架(复合情感表征)和神经认知机制(双过程架构)。当前技术已实现文本情感分析、多模态情感融合和动态概率建模,但在隐性情感识

文章图片
#人工智能
大模型LLM-MMOE

在现实世界中的大型应用场景,如推荐系统中,多任务学习技术已经取得了成功。比如在推荐电影时,系统不仅要推荐用户可能购买和观看的电影,还希望用户在观看后喜欢这些电影。多任务学习的目标是创建一个模型,能够同时学习多个目标和任务。但是,现有的多任务学习模型在预测准确性上,往往受到不同任务之间关系的影响。因此,研究如何在学习过程中平衡每个任务的独特需求和任务之间的相互关系,是非常重要的。为了解决这个问题,我

文章图片
#人工智能
Agent-提示链(prompt chaining)

你有没有过这样的经历?让AI写一篇带数据支撑的报告,结果它漏了关键指标;让它处理发票提取信息,输出格式混乱根本没法用;让它解答复杂问题,要么答非所问,要么满是“幻觉”?其实不是AI不够强,而是你用错了方式——。今天要讲的「提示链(Prompt Chaining)」,就是解决这个问题的核心方法论:把棘手任务拆成“流水线”,让AI一步步接力完成,既靠谱又可控。

文章图片
#人工智能
Qwen3

2025年4月29日,阿里巴巴发布了新一代开源大模型Qwen3(通义千问3),提供2款混合专家(MoE)模型和6款稠密模型,参数规模从0.6B到235B,适用于手机、汽车及企业级部署。Qwen3采用Transformer架构,MoE模型通过动态激活参数提升效率,推理成本大幅降低。训练数据量达36万亿token,支持119种语言,首创“混合推理模型”,结合快慢思考模式优化响应与准确性。Qwen3在编

文章图片
#人工智能
COT数据如何生成

首先要明确问题是属于数学、自然科学、社会科学、人文艺术等哪个大的领域。例如,如果是生成关于物理问题的CoT数据,就需要熟悉物理的各种概念,如力学、电磁学、热学等。因为不同领域的问题有着不同的知识体系和推理方式。:在确定领域后,进一步细分问题类型。以数学领域为例,有代数问题(如解方程、函数求值等)、几何问题(如证明三角形全等、求几何图形的面积等)和概率统计问题(如计算事件概率、数据分析等)。对于不同

文章图片
#机器学习
具有 “幻觉” 特性的人工智能如何助力科学实现重大突破

部分科学家觉得它有误导性,认为生成式人工智能模型产生的内容并非毫无根据的虚幻之物,而是具有一定前瞻性,有可能在未来成为现实,这和科学研究早期提出的推测性质类似,所以他们不认可“幻觉”这个说法,在自己的研究中也避免使用该词。如今,人工智能的“幻觉”就像给传统科学方法注入了新能量,大大加快了科学家构思、验证新想法的速度,以往需要数年的科研过程,现在可能短至几天、几小时甚至几分钟就能完成,还助力科学家开

文章图片
#人工智能
    共 25 条
  • 1
  • 2
  • 3
  • 请选择