logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

多模态知识图谱的构建及在热点新闻事件中的应用

本文探讨了多模态知识图谱(MMKG)的技术原理、构建方法及其在俄乌冲突事件中的应用。随着大模型技术的发展,知识图谱从纯文本表示转向融合图像、视频、音频等多模态数据,通过实体链接增强语义理解。构建方法包括从图像到符号的标注方式和从符号到图像的定位方式。以俄乌冲突为例,多模态知识图谱可整合新闻、图像等异构数据,支持事件脉络梳理、演进推断和虚假信息识别,实现从感知到认知的跨越。文章指出,知识图谱本质应是

文章图片
#知识图谱#人工智能
大模型知识学习 :文本预处理 - Tokenizer

本文探讨了自然语言处理(NLP)中分词器(Tokenizer)的核心作用及其技术实现。Tokenizer作为文本处理的首要环节,将原始文本转换为机器可处理的离散单元(token),为后续的词嵌入、语法解析和模型训练奠定基础。文章系统梳理了Tokenizer的工作原理、训练方法及与词嵌入的关系,对比分析了空格分词、正则表达式、WordPiece、BPE等主流分词算法的特点与适用场景。同时详细介绍了K

文章图片
#学习#自然语言处理#运维开发
项目还是产品:小团队的生存与发展之辩

《人月神话》重读启示:2025年产品与项目两难困境的反思与破局 摘要:本文复盘2025年技术团队管理困境:虽完成收入KPI,但产品研发折戟。项目与产品的两难选择——做项目保障生存却难沉淀技术,做产品构筑壁垒但风险高。通过重读《人月神话》,作者获得几点破局启示。文章指出,在AI时代浪潮下,软件工程的本质复杂性依然存在,管理者需回归基本逻辑,在生存与发展间寻求平衡。

文章图片
#学习方法#程序人生#软件工程 +2
多模态知识图谱的构建及在热点新闻事件中的应用

本文探讨了多模态知识图谱(MMKG)的技术原理、构建方法及其在俄乌冲突事件中的应用。随着大模型技术的发展,知识图谱从纯文本表示转向融合图像、视频、音频等多模态数据,通过实体链接增强语义理解。构建方法包括从图像到符号的标注方式和从符号到图像的定位方式。以俄乌冲突为例,多模态知识图谱可整合新闻、图像等异构数据,支持事件脉络梳理、演进推断和虚假信息识别,实现从感知到认知的跨越。文章指出,知识图谱本质应是

文章图片
#知识图谱#人工智能
大模型知识学习 :文本预处理 - Tokenizer

本文探讨了自然语言处理(NLP)中分词器(Tokenizer)的核心作用及其技术实现。Tokenizer作为文本处理的首要环节,将原始文本转换为机器可处理的离散单元(token),为后续的词嵌入、语法解析和模型训练奠定基础。文章系统梳理了Tokenizer的工作原理、训练方法及与词嵌入的关系,对比分析了空格分词、正则表达式、WordPiece、BPE等主流分词算法的特点与适用场景。同时详细介绍了K

文章图片
#学习#自然语言处理#运维开发
到底了