logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

NLP | 一文搞懂如何微调抱脸(Hugging Face)模型

微调自然语言处理 (NLP) 模型需要更改模型的超参数和架构,并且通常会调整数据集以提高模型在给定任务上的性能。您可以通过调整学习率、模型中的层数、嵌入的大小以及各种其他参数来实现这一点。微调是一个耗时的过程,需要牢牢掌握模型和工作。本文将介绍如何微调抱脸模型。

文章图片
#自然语言处理#人工智能
【Mo 人工智能技术博客】StarGAN——生成你的明星脸

1 GAN 介绍GAN,叫做生成对抗网络 (Generative Adversarial Network) 。其基本原理是生成器网络 G(Generator) 和判别器网络 D(Discriminator) 相互博弈。生成器网络 G 的主要作用是生成图片,在输入一个随机编码 (random code) z后,自动的生成假样本 G(z) 。判别器网络 D 的主要作用是判断输入是否为真实样本并提供..

#人工智能
【Mo 人工智能技术博客】文本挖掘之LDA主题模型

文本挖掘之LDA主题模型作者:郑培引言主题模型是文本挖掘的重要工具,近年来在工业界和学术界都获得了非常多的关注。在文本挖掘领域,大量的数据都是非结构化的,很难从信息中直接获取相关和期望的信息,一种文本挖掘的方法:主题模型(Topic Model)能够识别在文档里的主题,并且挖掘语料里隐藏信息,并且在主题聚合、从非结构化文本中提取信息、特征选择等场景有广泛的用途。Latent Dirichl....

文章图片
#人工智能#深度学习
基于大型语言模型(LLM)的应用程序开发新手教程:快速上手 Langchain

由 Harrison Chase 创建的 LangChain 是一个开源框架,支持由语言模型驱动的应用程序开发。有两个包,即。Python 和 JavaScript(TypeScript),专注于组合和模块化。

文章图片
值得收藏!面试必备!不容错过的30+ 大语言模型面试问题及答案

答:大语言模型(LLM)是一种人工智能系统,它能够通过学习大量的文本资料,从而学会理解和生成类似人类的语言。通过应用机器学习技术,在训练数据中找出某种模式和相关性,这些模型能够输出既符合逻辑又符合上下文的语言。答:初始提示结构:总结以下有关 [Topic/URL] 的 Web 文档:提示以有关如何总结的明确说明开始。占位符允许您输入要汇总的 Web 文档的特定主题或 URL。如果初始摘要不清楚或太

文章图片
#面试#语言模型#职场和发展 +1
LangChain:自动化大型语言模型 (LLM) 评估

大型语言模型 (LLM) 以其生成人类质量文本、翻译语言、总结内容和回答复杂问题的能力吸引了世界。突出的例子包括 OpenAI 的 GPT-3.5、谷歌的 Gemini、Meta 的 Llama2 等。随着 LLM 变得越来越强大和复杂,衡量基于 LLM 的应用程序性能的重要性也越来越大。评估 LLM 对于确保它们在各种 NLP 应用程序中的性能、可靠性和公平性至关重要。在本文中,我们将探讨与评估

文章图片
#自动化#语言模型
【Mo 人工智能技术博客】生成式对抗网络模型综述

生成式对抗网络模型综述作者:张真源GANGAN简介生成式对抗网络(Generative adversarial networks,GANs)的核心思想源自于零和博弈,包括生成器和判别器两个部分。生成器接收随机变量并生成“假”样本,判别器则用于判断输入的样本是真实的还是合成的。两者通过相互对抗来获得彼此性能的提升。判别器所作的其实就是一个二分类任务,我们可以计算他的损失并进行反向传播求出梯度,从而进

文章图片
#自然语言处理#神经网络
【Mo 人工智能技术博客】CNN实现表情识别

作者:魏祖昌一、背景介绍2020年1月29日,教育部有关负责人在接受采访时表示,防控新型冠状病毒肺炎是当前头等重要的大事,各级教育部门正按教育部和当地党委政府统一部署要求,全力防控,坚决防止疫情在学校蔓延,延期开学是其中的一项重要举措。与此同时,各地教育部门也为服务保障防控疫情期间中小学校“停课不停教、不停学”做了大量工作。线上教学随即由此出现了。但是随着网络教学的升入进行,教师不能通过像教...

文章图片
#cnn#深度学习#人工智能
谷歌人工智能提前 5 天预测河流洪水

在本文中,我们将了解谷歌的研究论文,该论文探讨了使用人工智能 (AI) 提前 5 天预测河流洪水,详细介绍了其对 80 多个国家的潜在影响,尤其是在数据稀缺和脆弱的地区。谷歌的研究论文深入探讨了人工智能在全球洪水预报中的应用,重点介绍了人工智能流量预测模型的发展,该模型扩展了以前在水文临近预报模型方面的工作。基于人工智能的预报提供了一个有前途的解决方案,将当前全球临近预报的可靠性延长到5天的准备时

文章图片
#人工智能
【Mo 人工智能技术博客】GeoMAN:多层Attention网络用于地理传感器的时序性预测

GeoMAN:多层Attention网络用于地理传感器的时序性预测作者: 魏祖昌1 简介在我们现实生活中,已经部署大量的传感器(比如气象站点)。每一个传感器都有自己独特的地理空间位置,并且不断的产生时间序列读数。一组传感器共同监测一个空间的环境,这些读数之间就会有空间相关性,我们称这些传感器的读数为地理感知时间序列。此外,当不同空间位置用同一种传感器来监测, 通常会产生多种地理感知的时间序列...

文章图片
#人工智能
    共 131 条
  • 1
  • 2
  • 3
  • 14
  • 请选择