logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【大模型】大模型相关技术研究,资料整理

大模型推理性能优化的一个常用技术是KV Cache,该技术可以在不影响任何计算精度的前提下,通过空间换时间思想,提高推理性能。生成式generative模型的推理过程很有特点,我们给一个输入文本,模型会输出一个回答(长度为N),其实该过程中执行了N次推理过程。即GPT类模型一次推理只输出一个token,输出token会与输入tokens 拼接在一起,然后作为下一次推理的输入,这样不断反复直到遇到终

文章图片
#python#深度学习#人工智能
人工智能写论文工具-公式+绘图+配色

模块在线绘图工具效果展示:在线latex公式工具:公式识别:公式编辑:效果展示:折线对比绘画工具:效果展示:解决适配中文字体问题:

文章图片
#人工智能
【大模型】大模型相关技术研究,资料整理

大模型推理性能优化的一个常用技术是KV Cache,该技术可以在不影响任何计算精度的前提下,通过空间换时间思想,提高推理性能。生成式generative模型的推理过程很有特点,我们给一个输入文本,模型会输出一个回答(长度为N),其实该过程中执行了N次推理过程。即GPT类模型一次推理只输出一个token,输出token会与输入tokens 拼接在一起,然后作为下一次推理的输入,这样不断反复直到遇到终

文章图片
#python#深度学习#人工智能
人工智能写论文工具-公式+绘图+配色

模块在线绘图工具效果展示:在线latex公式工具:公式识别:公式编辑:效果展示:折线对比绘画工具:效果展示:解决适配中文字体问题:

文章图片
#人工智能
【大模型】微调实战—使用 ORPO 微调 Llama 3

ORPO 是一种新颖微调(fine-tuning)技术,它将传统的监督微调(supervised fine-tuning)和偏好对齐(preference alignment)阶段合并为一个过程。这减少了训练所需的计算资源和时间。此外,实证结果表明,ORPO 在各种模型规模和基准测试(benchmarks)上优于其他对齐方法。在本文中,我们将使用 ORPO 和 TRL 库对新的 Llama 3 8

文章图片
#人工智能
【大模型】什么是大模型框架?常用的大模型框架盘点对比

大模型框架是指用于训练、推理和部署大型语言模型(LLMs)的软件工具和库。这些框架通常提供了高效的计算资源管理、分布式训练、模型优化和推理加速等功能,以便更好地利用硬件资源(如GPU和TPU)来处理庞大的数据集和复杂的模型结构。大模型框架的优点高效性:通过优化计算和内存管理,这些框架能够显著提高训练和推理的速度。可扩展性:支持分布式训练,可以在多个GPU或TPU上运行,适用于大规模数据集和复杂任务

文章图片
#深度学习#人工智能#python
【大模型】微调实战—使用 ORPO 微调 Llama 3

ORPO 是一种新颖微调(fine-tuning)技术,它将传统的监督微调(supervised fine-tuning)和偏好对齐(preference alignment)阶段合并为一个过程。这减少了训练所需的计算资源和时间。此外,实证结果表明,ORPO 在各种模型规模和基准测试(benchmarks)上优于其他对齐方法。在本文中,我们将使用 ORPO 和 TRL 库对新的 Llama 3 8

文章图片
#人工智能
【热图生成】关键点检测/信号定位,heatmap生成

heatmap_smooth = gaussian_filter(heatmap, sigma=1)决定整体热力大小。效果展示:heatmap[y, x] = random.random()决定每个点概率。代码参考chatgpt生成。

文章图片
#python#深度学习#人工智能
【大模型】微调实战—使用 ORPO 微调 Llama 3

ORPO 是一种新颖微调(fine-tuning)技术,它将传统的监督微调(supervised fine-tuning)和偏好对齐(preference alignment)阶段合并为一个过程。这减少了训练所需的计算资源和时间。此外,实证结果表明,ORPO 在各种模型规模和基准测试(benchmarks)上优于其他对齐方法。在本文中,我们将使用 ORPO 和 TRL 库对新的 Llama 3 8

文章图片
#人工智能
【大模型】大模型相关技术研究,资料整理

大模型推理性能优化的一个常用技术是KV Cache,该技术可以在不影响任何计算精度的前提下,通过空间换时间思想,提高推理性能。生成式generative模型的推理过程很有特点,我们给一个输入文本,模型会输出一个回答(长度为N),其实该过程中执行了N次推理过程。即GPT类模型一次推理只输出一个token,输出token会与输入tokens 拼接在一起,然后作为下一次推理的输入,这样不断反复直到遇到终

文章图片
#python#深度学习#人工智能
    共 17 条
  • 1
  • 2
  • 请选择