
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
A 股市场同样未能幸免,算力硬件股纷纷崩盘,铜高速连接、CPO 等相关板块领跌,A 股股王寒武纪盘中一度深跌 10%,港股中芯国际也大幅下跌逾 10%。2024 年底,幻方推出的 DeepSeek-v3 横空出世,它仅耗费 550 万元、使用 2000 张卡就完成了训练,但其表现却与 OpenAI 耗费数亿资金打造出来的模型不相上下。在刚刚过去的这个周末,一款来自中国的 AI 大模型 DeepSe

机器学习特征工程-特征选择之IV
Tensorflow2.* 机器学习基础知识篇:对服装图像进行分类使用Tensorflow Hub对未处理的电影评论数据集IMDB进行分类Keras 机器学习基础知识之对预处理的电影评论文本分类Tensorflow2.*教程之使用Auto MPG数据集构建回归模型预测燃油率Tensorflow2.* 加载和预处理数据篇:Tensorflow2.* 加载和预处理数据之用 tf.data 加载 CSV
众所周知,计算机视觉(CV)是人工智能研究领域的比较重要的一环。今天是中秋节的第二天,我写该文章的目的是来总结一下计算机视觉之图像分割相关内容,这些内容是对网络上所有内容的归纳,参考了两位博主的优秀博文,具体链接我会在后面给出。为什么要进行图像分割研究呢?图像分割是图像处理和计算机视觉的热点之一,它是图像分析和理解图像特征提取和识别的基础。什么是图像分割?把图像分成若干个特定的、具有...
无论是如今爆火的LLMs(Large Language Models)技术,还是传统的NLP技术,分词环节都是至关重要的一步。为了更好地了解中文自然语言处理的关键环节,今天我想和大家分享分词技术—基于词图的机械分词法。本文主要围绕中文分词为主进行讲解,我会从分词定义及原因,分词的应用场景,分词的难点,什么是语言模型,马尔科夫假设,基于词图的分词方法这几个方面来书写这篇文章。

无论是如今爆火的LLMs(Large Language Models)技术,还是传统的NLP技术,分词环节都是至关重要的一步。为了更好地了解中文自然语言处理的关键环节,今天我想和大家分享分词技术—基于词图的机械分词法。本文主要围绕中文分词为主进行讲解,我会从分词定义及原因,分词的应用场景,分词的难点,什么是语言模型,马尔科夫假设,基于词图的分词方法这几个方面来书写这篇文章。

腾讯近期推出了基于Transformer架构的混合专家(MoE)模型——Hunyuan-Large(Hunyuan-MoE-A52B)。该模型目前是业界开源的最大MoE模型之一,拥有3890亿总参数和520亿激活参数,展示了极强的计算能力和资源优化优势。具体文章,如下可见,保证你不吃亏。

今天,我将介绍一种基于多级小波分解的时序预测算法——WPMixer,该算法旨在有效捕捉时间序列数据中的多分辨率信息,涵盖时间域和频率域的特征。随着数据的复杂性和多变性增加,传统的时间序列预测方法往往难以处理数据中的突然波动和长期依赖关系。WPMixer通过引入小波变换的多级分解,能够在多个尺度上同时提取时序数据的局部和全局特征,从而增强模型对数据复杂性和变化模式的适应性。此外,WPMixer采用补

在时序预测领域,如何有效地利用外部变量(exogenous variables)来提升内部变量(endogenous variables)的预测性能一直是一个挑战。今天,我为大家带来一篇2024年最新基于Transformer架构的创新之作——,这篇论文成功解决了这一问题,并在多个实际应用场景中展示了出色的性能。老样子,我还是按照论文的框架对其进行详细解读。

今天我分享一篇关于 Transformer 架构在图像视觉分割中的应用的文章,主题是 SegFormer。SegFormer 是一种新颖的语义分割方法,它结合了无位置编码的层次化 Transformer 编码器和轻量级 All-MLP 解码器,避免了传统方法中的复杂设计,实现了高效与高性能的平衡。下面是基于论文整体架构的解读方式,可以帮助逐步剖析SegFormer的核心思想和贡献。完整内容,通过下








