logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

哈尔滨工业大学(深圳)计算机学院陈科海老师招收硕博研究生

2020年获中国中文信息学会“优秀博士学位论文”奖,2022年获北京市科技进步二等奖,2023年获“鹏城孔雀计划”特聘岗位B档,2024年获“钱伟长中文信息处理科学技术奖”科技进步一等奖。主要研究方向聚焦于大模型、自然语言处理、智能体、多模态等,在ACL、ICLR、EMNLP、AAAI、TASLP等国际会议和期刊发表论文60余篇。陈科海,博士,哈尔滨工业大学(深圳)计算机学院教授,博士生导师,国家

强大新RAG范式!动态将上下文转化为参数知识,有效缓解RAG幻觉!

虽然它通过提供事实文本提高了可靠性,但随着上下文长度的增长,显著增加了推理成本,并引入了具有挑战性的RAG幻觉问题,这主要是由于LLM中缺乏相应的参数知识造成的。通过详细的时间复杂度计算和实际运行时间对比,我们提出的DyPRAG能有效提升模型性能,同时减少RAG带来的高推理开销以及PRAG带来的极高训练和存储开销(仅1%),更证明方法。的潜在映射,仅需要少量的训练数据就能有效学习到泛化性极强的转换

邀请参与首届XLLM Workshop @ ACL 2025

第一届大语言模型与语言结构建模 Workshop (XLLM 2025) 将会依托 ACL 2025,于奥地利维也纳,25年7月31日至8月1日开展。欢迎论文投稿和参与公开挑战任务。了解更多信息,请访问XLLM Workshop官网: https://xllms.github.io/您是否对自然语言处理(NLP)中的基于大语言模型(LLM)的语言结构预测或建模(如句法/语义、信息抽取和结构化情感计

新一代RAG框架DeepSieve:让LLM成为知识导航员,破解RAG异构检索难题

DeepSieve(Naive RAG)在MuSiQue上F1达46.8(+13.5 vs 最佳基线),平均F1 58.9,显著优于所有基线。的复杂问题(如实时新闻、专业领域查询)。成功集成SQL数据库与RAG文本库,解决纯RAG无法处理的约束过滤问题(如“19世纪出生”)。:从扁平化索引中检索,无视知识源的异构性(如API、数据库、文本库的格式差异)。:分解、路由、反思、融合可独立替换(如路由器

ScreenCoder:视觉-代码对齐新范式,为多模态程序合成开辟道路

本文提出首个模块化多智能体框架,通过三阶段分工协作,实现精准、可解释、支持交互的代码生成,同时构建数据引擎推动VLMs进化。现有基于文本的AI工具(如GPT-4)需冗长描述才能指定布局细节,而视觉语言模型(VLMs)虽可直接解析设计图,却常出现。低级指标:组件匹配(Block)、文字精度(Text)、位置对齐(Pos)、颜色一致性(Color):为每个节点生成专属提示(例:“生成一个固定在顶部的蓝

LLM算力告急?把文本变图片,推理成本直接减半!

在多模态大语言模型中,视觉文本输入可将解码器令牌数量减少近一半,且在长上下文检索与文档摘要任务中保持性能无损。另一方面,多模态模型(如GPT-4V、Gemini)天然具备从图像中读取文本的能力,其视觉编码器能将图像转换为固定长度的视觉令牌序列,且数量远少于原始文本令牌。通过将长文本渲染为单张图像,并直接输入多模态模型,作者发现解码器所需的令牌数量可减少近一半,且任务性能未受显著影响。论文提出一个简

几乎解决所有多模态大模型问题。

除了个人科研成绩突出,更有丰富的论文辅导经验,不仅自己能写出顶会一作,更指导出多名发独立一作论文的学生,满足各个方向的辅导需求。不止是交付论文初稿就结束服务,针对指定服务方案的学员,哪怕遇到拒稿、退稿情况,也会提供免费修改优化的维护服务,1v1量身制作您的科研课程,不同的分区价格不同,课程顾问会根据你的情况给你做详细的介绍,以及后期的学习规划。篇幅有限,仅展示部分课题,名额有限,先到先得,趁着开学

“反转诅咒“彻底解决,反向推理准确率96%!新架构突破LLM多年认知瓶颈

或许未来的AI会像《超验骇客》中的AI,真正理解"巴黎不只是一个地名,更是历史、艺术与浪漫的集合体"。这种现象暴露了当前大语言模型的致命弱点:它们像死记硬背的学生,无法理解知识的内在关联。"反转诅咒":一个令人头疼的Bug:想象你教LLM记住"张三的妻子是李四",但当问"李四的丈夫是谁"时,却一脸懵——这就是。这说明AI终于学会"触类旁通":知道X=5、Y=3、X+Y=Z后,能自动推导Z=8并反向

明晚直播 | 当逻辑遇见图像:多模态大模型能进行严谨的逻辑推理吗?

在医疗、法律、金融等高风险的现实应用场景中,任何细微的逻辑偏差都可能导致严重后果,因此对推理的严谨性提出了极高要求。尽管目前已有不少纯文本逻辑推理评测基准,但现实中的许多任务往往融合了视觉与文本信息,亟需模型具备跨模态的严密推理能力。例如,在交通控制或自动驾驶系统中,模型不仅需要理解交通规则文本,还需结合实时驾驶场景的图像信息,通过可靠推理做出安全且合规的决策。项目地址:https://llm-s

Qwen数学“超能力“的真相:是推理还是记忆?

使用随机奖励(如抛硬币决定对错)时,Qwen2.5在MATH-500的准确率仍显著上升(+15%),而同样方法使Llama性能下降。:在MATH-500上,仅凭60%题目前缀可精确补全剩余文本(54.6% EM),且答案准确率高达53.6%。,研究者实证了Qwen2.5在MATH-500上的"魔法增益"实为记忆召回,而在干净环境中,(答案正确=1,错误=0),但对含小数的复杂算术题无效(模型几乎得

#人工智能
    共 1128 条
  • 1
  • 2
  • 3
  • 113
  • 请选择