logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

国内真正的免费GPU算力(学习人工智能的福利)

国内免费GPU算力1. 百度:飞桨PaddlePaddlehttps://ai.baidu.com/support/news?action=detail&id=981点击打开 每天送12小时 连续五天送48小时2. 华为: ModelArtshttps://activity.huaweicloud.com/2020ModelArts_Promotion.html?ch=1点击打开免费规格用

#pytorch#tensorflow#神经网络 +2
国内真正的免费GPU算力(学习人工智能的福利)

国内免费GPU算力1. 百度:飞桨PaddlePaddlehttps://ai.baidu.com/support/news?action=detail&id=981点击打开 每天送12小时 连续五天送48小时2. 华为: ModelArtshttps://activity.huaweicloud.com/2020ModelArts_Promotion.html?ch=1点击打开免费规格用

#pytorch#tensorflow#神经网络 +2
国产开源神器!GPT Server:一站式部署大模型全家桶,兼容 OpenAI 接口!

简单来说,GPT Server是一个提供标准 OpenAI 风格 API 的多模态大模型服务。无论你是想做文本生成embeddingreranker语音转文字图片生成,还是内容审核,它都能通过一套统一的接口搞定,极大降低了集成难度。✅ 完全兼容 OpenAI 客户端调用方式✅ 支持多种高性能推理后端✅ 多个模型共享一个端口,自动调度✅ 持续更新,紧跟最新模型发布节奏如果你正在为如何快速部署 Qwe

文章图片
#开源#AIGC#深度学习
国产开源神器!GPT Server:一站式部署大模型全家桶,兼容 OpenAI 接口!

简单来说,GPT Server是一个提供标准 OpenAI 风格 API 的多模态大模型服务。无论你是想做文本生成embeddingreranker语音转文字图片生成,还是内容审核,它都能通过一套统一的接口搞定,极大降低了集成难度。✅ 完全兼容 OpenAI 客户端调用方式✅ 支持多种高性能推理后端✅ 多个模型共享一个端口,自动调度✅ 持续更新,紧跟最新模型发布节奏如果你正在为如何快速部署 Qwe

文章图片
#开源#AIGC#深度学习
AI 智能体的终极记忆方案?来认识一下 Graphiti

Graphiti:专为AI Agent设计的动态知识图谱框架 Graphiti是Zep平台推出的新一代开源图框架,专为AI智能体的记忆系统设计。与传统RAG技术相比,Graphiti具有以下核心优势: 实时增量更新能力:可即时处理新增数据,无需批量重算 双时间维度模型:同时记录事件发生时间和系统录入时间 混合检索机制:结合语义、关键词和图路径进行精确查询 自动失效机制:能智能识别并标记过时信息 高

#人工智能
AI 智能体的终极记忆方案?来认识一下 Graphiti

Graphiti:专为AI Agent设计的动态知识图谱框架 Graphiti是Zep平台推出的新一代开源图框架,专为AI智能体的记忆系统设计。与传统RAG技术相比,Graphiti具有以下核心优势: 实时增量更新能力:可即时处理新增数据,无需批量重算 双时间维度模型:同时记录事件发生时间和系统录入时间 混合检索机制:结合语义、关键词和图路径进行精确查询 自动失效机制:能智能识别并标记过时信息 高

#人工智能
深度学习 pytorch 困惑度计算方法

以下是我 编写的 计算 困惑度 PPL的 代码根据困惑度的定义:PPL=ecross_entropyPPL=e^{cross\_entropy}PPL=ecross_entropy其中cross_entropycross\_entropycross_entropy 就是交叉熵损失因此只需要对 交叉熵损失求exp()注意:F.cross_entropy的参数 reduction必须要为 mean 即

#自然语言处理#pytorch#深度学习 +2
修改huggingface 模型output_hidden_states=True时,CUDA out of memory问题。

在使用huggingface 提供的Trainer进行模型预测时,如果训练时output_hidden_states=True,则显存占用会无限增加,最终导致CUDA out of memory 内存溢出错误。在模型的最终返回值处,把hidden_states 设置为None 即可,具体原因我也不清楚。

#深度学习#人工智能
从huggingface hub 中下载模型或者数据

【代码】从huggingface hub 中下载模型或者数据。

文章图片
#服务器#深度学习#自然语言处理 +2
零售商品销售预测

研究、设计内容:在电子商务业务蓬勃发展的同时,零售业遭遇了寒潮。电子商务的冲击、瞬息万变的经济环境、难以捉摸的销售情况和日益冷清的大型卖场,都给零售业带来了重重困难。进入数字时代后,数据的有效使用成为零售企业颠覆传统的动力,也势必将改变零售业的格局。沃尔玛等大型零售商都积极第将数据分析与商业结合,创造了额外的经济收益。某大型零售商的数据科学家收集了不同城市10家商店1539种商品在2013年的销售

#机器学习
    共 14 条
  • 1
  • 2
  • 请选择