logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

搜索产品业务理解

在信息获取方式上,当用户在没有明确诉求场景下会逛信息流,当用户有明确诉求时则使用搜索做信息获取。今天我带大家简单了解一下搜索产品的基本知识,并介绍搜索场景的核心指标体系。01 产品视角的搜索搜索入口:即输入框,典型入口位置有首页顶部搜索框。是用户发起搜索的窗口。搜索前:即搜索起始页,这个页面一般有两个产品定位:扩认知(比如点评搜索起始的发现模块,主要是推荐一些平台强运营的关键词,建立用户点评可以搜

#p2p#网络协议#网络
浅谈搜索指标&业务辅助应用

对于生鲜类电商,很多商品都不适合大量囤货,不然会造成商品的大量损耗。CTR和CVR并不是完全正相关的,很多SKU的CTR很高,但是CVR很低,比如一些标题夸张主图奇特的商品,用户可能会被商品的标题和主图等吸引产生点击,但是最终是否下单用户还是会根据自己的实际需求进行综合考虑的。但实际在业务开展的时候,负责搜索引擎的部门背的核心KPI就是搜索引擎的CTR、CVR和PGMV这三个指标,上述其他指标更多

文章图片
#搜索引擎#产品经理
意图识别和纠错问题

可想而知,错误的意图识别会带来多大的负面影响。基于词典,就是对用户query内容和词典内容进行比对,比较常见的方式是序列标注问题里用的最大逆向匹配,通过这种方式找到词典里的实体词,匹配触发了自然就有意图了,而在词典匹配的时候,不是使用链表之类的来构造匹配结构,而是使用搜索树的结构,这种匹配的复杂度最低,速度也快,两者结合,其速度甚至比很多模型要快得多(基本上1ms以内就能完成),fasttext速

#搜索引擎#产品经理
基于LangChain+ChatGLM2-6B+embedding构建行业知识库

目的:最近在探索大模型本地化部署+知识库实现行业解决方案,安装过程记录,分享给需要的同学,安装前确定好各组件的版本非常重要,避免重复安装走老路。方案一:使用开源LLM本地部署和微调优点:数据最安全,因为不管是模型还是训练数据都在本地缺点:要调教出一个足够出色的模型,需要耗费较多的人力物力(当然相比于预训练已经好太多了)具体实施:(LLAMA、ChatGLM2)+(Lora、P-Tuningv2、p

文章图片
#语言模型
主流大数据调度工具对比(DolphinScheduler特点)

大数据环境下,调度工具比不可少,离线批任务和准实时任务都需要调度去驱动。支持暂停恢复操作. 支持多租户,更好的应对大数据的使用场景. 支持更多的任务类型,如 spark, hive, mr, python, sub_process, shell。DAG 监控界面,所有流程定义都是可视化,通过拖拽任务定制DAG,通过API方式与第三方系统对接, 一键部署。支持自定义任务类型,调度器使用分布式调度,调

#大数据
电商搜索入门

但是对短文本的提取,特别是字符小于10的文本提取关键词,行业上也没有比较好的解决办法,从目前的测试数据来看,TF-IDF算法比较好一些。商品经过分词搜索,再经过权重模型计算排序后,就会展示在前端给客户查看,但是系统查询的结果不一定就百分百是用户想要的,所以用户可以自己根据一定的规则再次进行筛选新排序,最终找到自己的想要搜索结果。当用户输入查询关键词时,也有可能输入了和关键词意思相近的词语,比如用户

#算法#机器学习#人工智能
机器学习模型监控的 9 个技巧

如果您使用不同类型的特征(例如:词嵌入、地理位置坐标),您可能需要将它们解码(例如:分别解码为字符串和城市名称),以便您可以更轻松地分析报表和在绘图中的展示这些特征。这样做的原因是,许多数据问题对样例的某些子集具有关键影响,但它们在整个数据集的影响可能会“消失”,因为当您查看整个数据集的聚合值时,它们的绝对影响不足以感受到。您创建了一些实时警报(电子邮件、移动推送通知等),以在模型以意想不到的方式

#机器学习#人工智能
模型部署:TF Serving 的使用

p 8500:8500 -p 8501:8501表示将本地的端口映射到容器的端口,其中8500表示通信方式使用gPRC,8501使用Rest API进行通信,二选一,这里选择8500;一个重要的特性是:支持热更新与模型版本自动管理,这意味着一旦部署成功,不需要再为线上服务担心,只需要关心线下的模型训练即可;其中,重点是最后一步模型保存,需要保存成pb格式,如果你这边是其他格式,需要将其转换成pb;

文章图片
#深度学习#tensorflow
自动机器学习之Auto-Keras入门

对于训练深度学习,设计神经网络结构是其中技术含高最高的任务,优秀的网络架构往往依赖建构模型的经验,专业领域知识,以及大量的算力试错。实际应用中往往基于类似功能的神经网络微调生成新的网络结构。Auto-Keras是一个离线使用的开源库,用于构建神经网络结构和搜索超参数,支持RNN,CNN神经网络,它使用了高效神经网络搜索ENAS,利用迁移学习的原理将在前面任务中学到的权值应用于后期的模型中,效率..

模型部署:TF Serving 的使用

p 8500:8500 -p 8501:8501表示将本地的端口映射到容器的端口,其中8500表示通信方式使用gPRC,8501使用Rest API进行通信,二选一,这里选择8500;一个重要的特性是:支持热更新与模型版本自动管理,这意味着一旦部署成功,不需要再为线上服务担心,只需要关心线下的模型训练即可;其中,重点是最后一步模型保存,需要保存成pb格式,如果你这边是其他格式,需要将其转换成pb;

文章图片
#深度学习#tensorflow
    共 90 条
  • 1
  • 2
  • 3
  • 9
  • 请选择