Code1994 个人主页

@Code1994

Code1994

2023-03-09 15:55:13 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

大模型算法岗面试题系列（十二）| llama输入句子长度理论上可以无限长吗?

LLaMA（Large Language Model Meta AI）是一种大型语言模型，其设计允许它处理较长的输入句子。然而，理论上虽然可以无限长，实际上，由于计算资源、内存限制和模型架构的限制，输入句子的长度是有限制的。：处理长文本需要更多的内存和计算资源。如果句子过长，可能会超出硬件的内存限制或导致处理时间过长。：不同的模型架构可能有不同的输入长度限制。例如，基于Transformer的模型

#人工智能 #算法 #面试

大神带你从零构建大语言模型（中文版）【附PDF下载】

学习AI大模型是一个系统的过程，需要从基础开始，逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源包括：AI大模型全套学习路线图（从入门到实战）、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等，资料免费分享！

#语言模型 #人工智能 #自然语言处理

大模型开源项目 | 多模态大模型VideoGPT+：集成图像和视频编码器以增强视频理解

VideoGPT+，用于解决视频理解中的空间和时间信息结合问题。具体来说，VideoGPT+采用了图像编码器和视频编码器的双编码器设计，分别捕捉空间细节和时间上下文。图像编码器使用CLIP模型（ViT-L/14），视频编码器使用InternVideo-v2模型。为了捕捉细粒度的时间动态，VideoGPT+采用了分段采样策略，将视频分割成多个小段，并对每段的帧进行编码。相比均匀采样，分段采样减少了自

#人工智能 #AI

大模型 (LLM)LangChain面试题系列（八）LangChain 替代方案?

这些替代方案各有优缺点，您可以根据自己的需求和偏好选择最适合您的项目。

#人工智能 #AI

大模型微调的100个关键点（一）背景篇：Special Token、耗时问题、sft与pretrain 的区别、幻觉问题

AI大模型作为人工智能领域的重要技术突破，正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口，掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程，需要从基础开始，逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源，包括：AI大模型全套学习路线图（从入门到实战）、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等，资料免费分享！

#人工智能

大模型 (LLM)LangChain面试题系列（六）LangChain包含哪些特点?

这些特点使得 LangChain 成为构建语言模型驱动的应用的强大工具，无论是简单的聊天机器人还是复杂的业务流程自动化。引入了 Chain 和 Agent 的概念，用于定义和执行多步骤的任务流程，以及自动化的决策逻辑。支持多种预训练的语言模型，包括商业模型和开源模型，如 GPT-3、BERT、XLNet 等。作为开源项目，LangChain 拥有活跃的社区，不断更新和改进框架，提供新的特性和工具。

#人工智能 #AI #面试

大模型 (LLM)LangChain面试题系列（一）什么是LangChain？LangChain包含哪些核心概念?

LangChain 是一个开源框架，旨在帮助开发者和研究者更容易地构建和部署由语言模型驱动的应用程序。它提供了一个统一的接口和一系列工具，使得与大型语言模型（Large Language Models, LLMs）的交互更加简单和高效。简而言之，LangChain 是一个框架，它简化了构建语言模型应用的过程，使得开发者可以专注于应用逻辑而不是底层的模型交互细节。通过使用 LangChain，开发者

#人工智能 #AI #面试

大模型 (LLM)LangChain面试题系列（十四）LangChain中 Chat Message History 是什么?

并将它们与链（Chain）和其他组件一起使用，以构建更复杂的应用。通过这种方式，开发者可以构建强大的聊天机器人，而无需担心底层的上下文管理和记忆细节。这些消息记录包括用户输入和语言模型生成的回复，它们一起构成了对话的上下文。这些消息可以按照时间顺序排列，以便于在对话过程中引用和更新。每次用户输入时，我们都会将输入和回复添加到历史记录中。，开发者可以构建一个具有上下文记忆能力的聊天机器人，它能够根据

#人工智能 #面试

大模型入门到精通 | 终于把Transformer 搞懂了！（Transformer 的基本结构、核心组件）

今天给大家分享一个超强的算法模型，TransformerTransformer 算法是由 Vaswani 等人在 2017 年提出的一种新型神经网络架构，并迅速取代了传统的循环神经网络（RNN）和长短期记忆网络（LSTM）在许多任务中的主导地位。Transformer 算法的关键创新点是其自注意力机制，它通过自注意力机制解决了长期依赖问题，极大地提高了并行计算的效率。

#transformer #深度学习 #人工智能 +1

视频生成类大模型实现原理以及应用和难点

学习AI大模型是一个系统的过程，需要从基础开始，逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源，包括：AI大模型全套学习路线图（从入门到实战）、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等，资料免费分享！

#人工智能 #学习

共 54 条

请选择