logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Chroma 的设计哲学

你将 Query 传给 Chroma 后,Chroma 内部先用 DuckDB 的 SQL 在磁盘上按 metadata(比如 source=“wiki” 且 date>2024-01-01)筛出候选 id 列表,然后只把这些候选的 embedding 读入内存并计算相似度,减少计算量。可以看到,Chroma 的核心贡献在于向量搜索,至于存储,完全委托给了 duckdb 等嵌入式存储,他们各自发挥

#人工智能#数据库
学习小智 AI 生态

小智AI是一款由硬件、开源固件和服务端组成的聊天玩具,其台湾腔陪聊功能广受欢迎。最初闭源的服务端被团队复刻并开源,用户无需订阅即可永久使用。该系统整合了国内多家云服务商的免费AI方案,包括智谱的LLM和视觉模块。开发者可通过修改开源固件扩展硬件功能,或通过MCP扩展后端能力。小智的核心交互依赖于液晶显示和语音输入/输出模块,而后端服务则提供了丰富的扩展可能性。

#学习#人工智能
【解释】get ORA-12838: cannot read/modify an object after modifying it in parallel

本文内容基本来自下面的链接。用于详细解释为什么 Oracle PDML 操作后,commit/rollback 之前,不允许读操作。主要解释见标红部分。大意:PDML 的实现方式是,多个线程启动独立的事务做更新,然后用一个两阶段提交来提交所有事务,从而实现 PDML 大事务的提交。有点类似一个应用层方案。Parallel DMLThe Oracle documentation limits the

#数据库开发#数据库
在 MacOS 场景下体验 seekdb embeded

SeekDB目前尚不支持MacOS原生运行,但可通过Docker镜像体验。该工具处于概念演示阶段,提供流畅的体验和丰富的SDK接口,但需增强AI能力(如支持更多自定义模型和嵌入函数)及多媒体数据处理功能。安装步骤包括:1)通过Docker运行SeekDB;2)在容器内安装Python3和pip3;3)安装pyseekdb及相关依赖库。整体而言,SeekDB为开发者提供了便利的开发界面,但仍需完善功

#人工智能#数据库
TCP端口重用[转]

<br />原文:http://hi.baidu.com/liaimin/blog/item/07f1fdfa521ff0dbb58f315f.html<br /> <br /> <br />在以前的文章中,我曾经引用过一篇端口重用与端口独占程序设计。但是,后来我发现其中有一点写的不清楚,为清视听,善意为作者添加一点.setsockopt()中的第四个参数是端口重用与否的标志,为1则可重用,否则,

#服务器
C++ 中 switch 的性能优化

当 switch 的取值 “比较连续” 的情况下,编译器会使用 jump table 技术来优化 switch 的执行。当连续性很差的时候,优化效果不佳。

文章图片
#c++#开发语言
国产海光 x86_64 CPU 的 RDTSC 性能测试

RDTSC 是 x86 中最为轻量级的计时方案,虽然它不甚精确坑很多,但特定场景下依然好用。海光的 lscpu flags 中支持 RDTSC,本文通过一个简单 benchmark 来看海光的 RDTSC 实现效率(还不错)。

GPU 架构入门笔记

引文位置:https://www.trainy.ai/blog/gpu-utilization-misleading。相关概念是通过 ChatGPT 迅速学习总结而成。

文章图片
mysql.h

/* Copyright (C) 2000-2003 MySQL ABThis program is free software; you can redistribute it and/or modifyit under the terms of the GNU General Public License as published bythe Free Softwar

策略: Google在数据挖掘中使用Canary Request来试探测Query的破坏性

<br />Google在上千个节点上查询内存中的数据并合并结果,其中最严重的问题之一就是:死亡查询(Query of Death)<br /><br />一个查询可能导致一个程序失败,失败的原因可能是程序bug或者其它因素。这意味着一个单独的查询有可能导致整个集群崩溃。这对于可用性和响应时间来说都是不好的,因为重新恢复成千台机器的运行时环境需要较长时间。因此,将这样的查询称为死亡查询。新的查询不

#数据挖掘#集群#测试
    共 31 条
  • 1
  • 2
  • 3
  • 4
  • 请选择