logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【Gemini API】RetryError: Timeout of 60.0s exceeded, last exception: 503 failed to connect to all addr

[Solved] RetryError: Timeout of 60.0s exceeded, last exception: 503 failed to connect to all addresses; last error: UNKNOWN: ipv4:142.250.204.74:443: tcp handshaker shutdown

文章图片
#AI
BERT 论文精读【Pre-training of Deep Bidirectional Transformers for Language Understanding】

通过阅读本文将了解以下知识:1. 预训练任务 MLM 和 NSP 是什么?2. BERT 模型的输入和输出,以及一些与 Transformer 不同的地方。3. 以 $\text{BERT}_\text{BASE}$ 为例,计算模型的总参数量。...

文章图片
#bert#人工智能#深度学习 +2
Transformer 论文精读与完整代码复现【Attention Is All You Need】

Transformer论文精读和从零开始的完整代码复现(PyTorch),超长文预警!将介绍模型架构中的所有组件,并解答可能的困惑

文章图片
#transformer#pytorch#深度学习
目前 Claude / GPT 的订阅建议与反代避坑

20,000 刀用量后的 Claude / GPT 订阅建议 & 模型配额 & 反代避坑分享

文章图片
BERT 论文精读【Pre-training of Deep Bidirectional Transformers for Language Understanding】

通过阅读本文将了解以下知识:1. 预训练任务 MLM 和 NSP 是什么?2. BERT 模型的输入和输出,以及一些与 Transformer 不同的地方。3. 以 $\text{BERT}_\text{BASE}$ 为例,计算模型的总参数量。...

文章图片
#bert#人工智能#深度学习 +2
尝试微调 LLM 大型语言模型,让它会写唐诗

展示如何去微调一个大型语言模型,增强解决特定任务的能力。

文章图片
#语言模型#人工智能#自然语言处理 +1
2023李宏毅机器学习HW05样例代码中文注释版

2023李宏毅机器学习HW05样例代码中文注释版

文章图片
#机器学习#人工智能
李宏毅2023机器学习作业HW02解析和代码分享

李宏毅2023机器学习作业HW02解析和代码分享

文章图片
#机器学习#深度学习
李宏毅2024生成式人工智能导论 中文镜像版指导与作业

这里是李宏毅老师2024年生成式人工智能导论的大陆镜像版的索引文章,你可以在不翻墙的情况下完成课程的所有作业。制作与分享已经获得李宏毅老师的授权,非常感谢老师!

文章图片
#人工智能#AIGC
    共 70 条
  • 1
  • 2
  • 3
  • 7
  • 请选择