简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
Langchain-Chatchat一种利用思想实现的基于本地知识库的问答应用,目标期望建立一套对中文场景与开源模型支持友好、可离线运行的知识库问答解决方案。大致过程包括加载文件 -> 读取文本 -> 文本分割 -> 文本向量化 -> 问句向量化 -> 在文本向量中匹配出与问句向量最相似的top k个 -> 匹配出的文本作为上下文和问题一起添加到prompt中 -> 提交给LLM生成回答。Qwen
大语言模型 (large language model,LLM)是一种语言模型,由具有许多参数(通常数十亿个权重或更多)的人工神经网络组成,使用自监督学习或半监督学习对大量未标记文本进行训练。大语言模型在 2018 年左右出现,并在各种任务中表现出色。这个术语没有正式的定义,但它通常指的是参数数量在数十亿或更多数量级的深度学习模型。大型语言模型是通用的模型,在广泛的任务中表现出色,而不是针对一项特
目前国内至少有40个医疗大模型,足见这个行业的重要性,以及有着不错的发展前景。不过,大模型的本质是基于数据给出合理的判断和预测,帮助医生减负。在这种情况下,相同功能的大模型会逐渐拉开差距,性能差的医疗大模型将会被逐步淘汰,市场确实不需要如此多的医疗大模型。
还从互联网、金融、制造业等领域逐渐延伸至医疗、教育、交通等更多行业,较为成熟的大模型的应用生态丰富多样,从多模态数据处理到智能客服,人工智能技术正推动各行各业的数字化转型。2023 年以来,以ChatGPT、GPT-4 为代表的大模型技术的出台,因其强大的内容生成及多轮对话能力,引发全球新一轮人工智能创新热潮。通过对海量数据的深度学习和分析,大模型能够准确理解人类语言的深层含义,并将其与丰富的知识
原文:https://zhuanlan.zhihu.com/p/620360553要说2023刷屏最多的词条,ChatGPT可以说是无出其右。到最近的GPT-4,技术的革新俨然已呈现破圈之势,从学术圈到工业界再到资本圈,同时也真切逐步影响到普通人的日常生活与工作。坦白来讲,对于大语言模型生成相关的工作,个人长期以来持保守态度,认为这个方向更多的是一种深度学习的理想追求。现在看小丑竟是我自己,也许优
LangChain已经成为当前 LLM 应用框架的事实标准,这篇文章就来对 LangChain 基本概念以及其具体使用场景做一个整理。
本文将在 google 实验室中使用 Langchain-Chatchat 搭建一个知识库,还可以进行聊天等功能。由于是在 google 实验室上面跑代码,所以本地电脑什么配置都无所谓!效果图运行起来后可以上传各种文档文件到知识库。完整笔记: colab.research.google.com/drive/1TDYS…
人工智能产品经理的职位职责:将人工智能技术和行业知识结合,通过产品和项目的落地实现商业目标。
LlamaIndex和LangChain都是构建定制化LLM应用的有力工具。LlamaIndex擅长搜索和检索,而LangChain则以其模块化和集成性胜出。选择哪个,取决于具体的项目需求、易用性偏好和定制化程度。如果追求多功能集成和AI智能体,LangChain是理想选择。若目标是高效的信息索引和检索,LlamaIndex则更加合适。实际上,两个框架可以协同工作,不必二选一。
目前大模型的微调方法有很多,而且大多可以在消费级显卡上进行,每个人都可以在自己的电脑上微调自己的大模型。但是在微调时我们时常面对一个问题,就是数据集问题。网络上有许多开源数据集,但是很多时候我们并不想用这些数据集微调模型,我们更希望使用某本书、某个作者的作品、我们自己的聊天记录、某个角色的对话来微调模型。用于微调的数据通常是成千上万的问答对,如果手工搜集,需要花费大量时间。文本将介绍一种方式,利用