logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

CVPR 2024 获奖名单揭晓:北大上交获「最佳论文提名」,上海科技大学夺得「最佳学生论文」

覆盖了丰富多样的研究领域,包括视觉与图形、单视图3D重建、视觉语言推理、基于医学和物理学的视觉、自主导航和自我中心视觉、3D技术、行动和动作识别、数据和评估、多视角与传感器融合、低样本/无监督/半监督学习、地位视觉和遥感、图像与视频合成以及多模态学习。(CVPR)在美国西雅图拉开帷幕。该奖项授予那些经得起时间检验的论文,2024年的 Longuet-Higgins 奖表彰了2014年在CVPR上发

文章图片
#计算机视觉
NLP三大特征抽取器(CNN/RNN/TF)比较

目录NLP三大特征抽取器(CNN/RNN/TF)比较1. NLP任务1.1 NLP任务特点1.2 NLP任务类型2. RNN2.1 为什么RNN能够成为解决NLP问题的主流特征抽取器?2.2 RNN目前面临的两个严重问题3. CNN3.1 早期CNN模型结构3.2 目前主流CNN模型4. Transformer4.1 论文来源:Attention is all you need4.2 Tansfo

#人工智能#自然语言处理#深度学习 +1
各种优化器SGD,AdaGrad,Adam,LBFGS都做了什么?

文章目录各种优化器SGD,AdaGrad,Adam,LBFGS都做了什么?1. SGD:2. SGD+Momentum:3. NAG(Nesterov Accelerated Gradient ):4. AdaGrad(Adaptive Gradient Algorithm):5. AdaDelta:6. RMSProp:7. Adam:8. [AdaMax](https://arxiv.org/

#算法#机器学习#深度学习 +1
清华ChatGLM2-6B开源!第二代性能大幅提升,推理提速42%,最高支持32K上下文

推理性能提升了42%:基于 Multi-Query Attention 技术,ChatGLM2-6B有更高效的推理速度和更低的显存占用:在官方的模型实现下,推理速度相比初代提升了 42%,INT4 量化下,6G 显存支持的对话长度由 1K 提升到了 8K。在主要评估LLM模型中文能力的 C-Eval 榜单中,截至6月25日 ChatGLM2 模型以 71.1 的分数位居榜首,超越GPT-4,而最新

文章图片
#开源
最强开源大模型Llama 3发布!最大版本是4000亿参数规模!性能直逼GPT-4!

当地时间4月18日,Meta 官宣发布其最新开源大模型 Llama 3。目前,Llama 3 已经开放了 80亿 和 700亿 两个小参数版本,上下文窗口为8K。未来还有4000亿参数版本,支持多模态、超长上下文、多国语言!

文章图片
AI最新开源:LMSYS Org开源LongChat、法律大语言模型ChatLaw、中文医疗对话模型扁鹊

目前支持长上下文的开源大模型已经有支持65K的 MPT-7B-storyteller 和32K的ChatGLM2-6B,闭源大模型比如 Claude-100K and GPT-4-32K,但LMSYS Org的研究人员还是选择通过测试来印证它们是「李鬼」还是「李逵」。6月29日,来自LMSYS Org的研究人员发布了两个支持16k token上下文长度的开源大模型LongChat-7B和LongC

文章图片
#人工智能#语言模型#自然语言处理
PyTorch中torch、torchtext、torchvision、torchaudio与Python版本兼容性

截止发文,最新版本:torch 2.0.0,torchvision 0.15.1。截止发文,最新版本:torch 2.0.0,torchtext 0.15.1。截止发文,最新版本:torch 2.0.0,torchaudio 2.0.1。

文章图片
#python#pytorch#深度学习
gensim中常用的Word2Vec,Phrases,Phraser,KeyedVectors

文章目录1. Phrases 和Phraser2. Word2Vec3. KeyedVector词向量保存的各种数据格式词向量用处参考gensim API1. Phrases 和Phrasergensim.models.phrases.Phrases 和gensim.models.phrases.Phraser的用处是从句子中自动检测常用的短语表达,N-gram多元词组。Phrases模型可以构建

#python#深度学习#机器学习
常用的中文预训练模型、预训练词向量下载地址收藏

中文预训练模型下载原版:https://huggingface.co/modelsGoogle原版bert:https://github.com/google-research/bert中文XLNET预训练模型:https://github.com/ymcui/Chinese-XLNet (只有TensorFlow需转化) or https://huggingface.co/hfl/chinese

#自然语言处理#深度学习#tensorflow
    共 24 条
  • 1
  • 2
  • 3
  • 请选择