logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

deepseek r1从零搭建本地知识库10:嵌入模型和知识库建设

嵌入模型是一种将文本、图像、音频等非结构化数据转化为**低维稠密向量(Dense Vector)**的算法模型,这些向量(通常几百到几千维)能够捕捉数据的语义信息。核心目标:将抽象内容转化为计算机可理解的数值形式,同时保留其语义关联性

文章图片
#算法
deepseek r1完全本地部署实战教程09

【代码】deepseek r1完全本地部署实战教程09。

文章图片
#服务器#linux#运维
deepseek r1完全本地部署实战教程10

Ollama使用环境变量来进行配置,允许用户根据需要调整其行为。通过合理配置这些环境变量,用户可以优化Ollama的性能、安全性以及功能适应性,使其更好地服务于特定的应用场景或开发需求。

文章图片
#windows#人工智能
deepseek r1从零搭建本地知识库11:嵌入模型-跟着榜单去选型

2.1 MTEB 是什么?定位:权威的文本嵌入模型性能评测基准,覆盖检索(Retrieval)、分类(Classification)、聚类(Clustering)、语义相似度(Semantic Similarity)等 8 大类任务、58 个子任务。数据:涵盖 112 种语言,支持多语言模型横向对比。更新频率:排行榜定期更新,收录最新开源和商业模型。2.2 如何使用该排行榜?查看模型排名:默认按综

文章图片
#人工智能
数据仓库专题20-案例篇:电商领域数据主题域模型设计v0.1(改进意见征集中)

一、电商分类(平台+自营+复合) (1)平台型电商:淘宝+天猫+百度Mall等; (2)自营型电商:        2.1 综合型:京东(早期)+当当(早期);        2.2 垂直型:好像这种类型越来越少了; (3)复合型电商(平台+自营):京东+当当+亚马逊等; 二、平台型电商特点(三无+两有+一核心) (1)三无:无商品、无库存、无物流; (

数据仓库专题20-案例篇:电商领域数据主题域模型设计v0.1(改进意见征集中)

一、电商分类(平台+自营+复合) (1)平台型电商:淘宝+天猫+百度Mall等; (2)自营型电商:        2.1 综合型:京东(早期)+当当(早期);        2.2 垂直型:好像这种类型越来越少了; (3)复合型电商(平台+自营):京东+当当+亚马逊等; 二、平台型电商特点(三无+两有+一核心) (1)三无:无商品、无库存、无物流; (

python数据分析基础02:数据可视化分析

《数据可视化分析:方法与分类》摘要 数据可视化通过图形化手段揭示数据模式、趋势和异常,结合统计学与设计学支持决策分析。文章系统梳理了可视化方法:①按分析目标分为分布分析(直方图、箱线图)、关系分析(散点图、热力图)、构成分析(饼图、树状图)等8类;②按交互性分为静态报告与动态探索式可视化;③按数据维度分为单变量、多变量分析;④按图表类型分为基础图表与高级特殊图表(如桑基图)。强调可视化设计需遵循清

文章图片
#信息可视化#数据分析#数据挖掘
Ubuntu20.4 WSL2 无法访问github终极解决方案

困扰自己很久的问题,终于解决了。

文章图片
#bash#linux#vim
python数据分析基础11-信用评分卡关键指标WOE和IV

证据权重(WOE)是一种量化变量与目标事件关系的统计指标,通过比较分组内事件分布与整体差异来衡量证据强度。其计算公式为对数比率,数值方向反映风险高低,绝对值大小表示预测能力强弱。WOE在金融风控(信用评分、特征筛选)和风险评估(毒理学、医疗诊断)中广泛应用,能将非线性关系转化为线性可建模形式。常与IV值联合使用评估变量整体预测能力。虽存在分箱敏感等局限,但通过自动化分箱和深度学习等技术不断优化。W

文章图片
#python
14天手撸交互式问答数字人直播教程-课程计划

14天手撸交互式问答数字人直播教程-课程计划

文章图片
#语音识别#人工智能
    共 70 条
  • 1
  • 2
  • 3
  • 7
  • 请选择