
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文提出SAGE-VAD视频异常检测框架,通过语义增强与规则引导解决弱监督学习中的关键问题。创新性地设计混合提示集成(HPE)机制,融合人工模板与大模型描述构建鲁棒类别原型;引入帧级规则分数(TeacherScore)作为先验,优化关键帧筛选。在UCF-Crime和XD-Violence数据集上分别取得87.47% AUC和85.08% AP,显著优于基线方法。消融实验验证了各模块协同增强的有效性

摘要:本研究评估了国内五大生成式AI模型(智谱GLM-3turbo、讯飞星火V2.0、天工1.0、360智脑4.0和文心一言3.5)在解决经典力学问题时的表现。通过29道题目测试发现,这些AI在概念理解方面表现较好(平均得分13.27),推理计算次之(生活实践类10.70,学习探索类13.27),实验设计最差。其中"天工"在概念理解表现最优,"文心一言"在推

本文提出跨模态伪Token适配器(CMPTA)解决多模态情感分析中的模态融合难题。该方法通过轻量级注意力机制将视觉、音频特征转化为大语言模型可理解的伪Token,实现跨模态语义对齐。在SIMS-V2和MELD数据集上的实验表明,CMPTA在情感回归(MAE=0.308)和分类(WF1=59.49)任务中均优于现有方法。消融研究验证了时序特征对齐层和适配器的有效性,并发现6个伪Token能最优平衡信

本文提出跨模态伪Token适配器(CMPTA)解决多模态情感分析中的模态融合难题。该方法通过轻量级注意力机制将视觉、音频特征转化为大语言模型可理解的伪Token,实现跨模态语义对齐。在SIMS-V2和MELD数据集上的实验表明,CMPTA在情感回归(MAE=0.308)和分类(WF1=59.49)任务中均优于现有方法。消融研究验证了时序特征对齐层和适配器的有效性,并发现6个伪Token能最优平衡信

摘要:本研究以蜀南竹海景区为案例,提出基于大语言模型(LLM)与多源数据融合的智能导览优化方案。通过整合客流、交通、行为等数据,构建了包含个性化路线推荐、语音讲解、拥堵预测、停车服务和应急引导的智能系统。研究采用参数权重调整实现差异化推荐,开发动态扫码机制优化停车管理,并改进Dijkstra算法应对应急场景。对比分析显示,该系统在游客体验、管理效率等方面显著优于传统导览方式。研究为智慧景区建设提供

摘要:本文提出基于运营商合规数据的AI通话分析智能体解决方案,针对企业语音数据处理中的采集分散、效率低下和语义挖掘不足等问题。通过联通云犀平台与元景大模型构建"智能体实时动态调度CoE"引擎,实现语音采集、转写、语义理解到结构化输出的全链路自动化。实验表明,该方法在意图识别F1分数上显著优于传统方案,某物流企业应用后订单揽收率提升30%,投诉处理时效缩短至15分钟。研究为企业通

摘要:本文采用GWO-BP方法对晶圆机器人大臂进行疲劳寿命研究。通过有限元分析确定应力集中区域(最大等效应力7.2432MPa)和变形区域(最大变形0.47369mm),nCode软件预测寿命为537.5万-921.4万小时。建立BP神经网络模型,利用灰狼算法优化权重阈值,预测精度达97.17%,验证了该方法在疲劳寿命预测中的有效性,为结构优化提供了理论依据。

本研究构建了基于BERT与DeepSeek的智能舆情监测系统,包含数据采集、情感分析、可视化与报告生成四大模块。系统通过Selenium技术采集光明网等平台数据,采用微调BERT模型实现情感分类(准确率79.76%),并集成DeepSeek实现自动化报告生成。创新性地将"数据可视化-智能分析-决策支持"形成技术闭环,将传统8小时分析工作压缩至3分钟完成,为舆情监测提供了高效智能

本文针对高校心理健康服务存在的评测精度不足、时效性差等问题,提出基于多模态情感交互的学生心理健康支持系统。系统包含两个核心模块:基于校园大数据的实时心理状态监测模块,通过融合学生多源行为数据构建动态画像,提出的自监督学习方法显著提升识别准确率;基于大语言模型的情感支持模块,采用CNN-LSTM多模态情绪识别方法,实现85%以上的评测准确率。实验表明,系统在心理状态识别和早期干预方面具有显著优势,为

摘要:本研究探讨了AIGC与AR技术结合在传统文化创新传播中的应用。以"老北京闹市五味神"为主题,采用StableDiffusion生成图像,结合AI视频技术制作"伪Live2D"动画,再通过AR技术制成可扫描播放的互动色纸。研究表明,该技术路径显著降低了创作门槛,实现了从静态展示到动态交互的升级,为传统文化传播提供了"实体+数字"的创新








