logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

基于SimCSE和Faiss的文本向量检索实践

传统的文本检索一般是建立倒排索引,对搜索词的召回结果进行打分排序返回最终结果,但是在海量的数据面前,召回结果页面临着一些挑战。于是就有了基于语义的搜索,即将文本向量化,默认向量包含了文本的语义信息,匹配最近的向量返回结果。

文章图片
#faiss#深度学习#大数据 +1
大语言模型浅探一

近来,人工智能异常火热,ChatGPT的出现极大的推动了自然语言处理的发展,在推出仅两个月后,月活跃用户已达1亿,成为历史上增长最快的消费应用。OpenAI一直在研究生成式模型,在2018年6月发布了GPT,在2020年5月发布了GPT3,GPT3的模型参数也达到了1750 亿。但是为什么到现在ChatGPT才突然间火起来呢?众所周知,模型只有达到一定的参数量才会出现涌现能力,但是两年强模型参数已

文章图片
#语言模型#人工智能#自然语言处理
如何获得 “最大六边形” 的技能图

学习成就页包括贡献墙、个人能力、能力、最新动态和认可,今天的主角就是个人能力图,也叫个人能力雷达图。技能树答题、发布讨论帖、直播、gitcode提交代码、参加竞赛,有参加以上项目的,按照次数进行统计得分。

文章图片
#经验分享
到底了