
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
SurveyGo是一款基于AI技术的文献综述写作工具,最近体验了surveygo综述写作。其中surveygo的写作效果很不错。于是看了它的源码,并进行了分析。

摘要:随着大模型和RAG技术兴起,向量检索成为AI应用的关键桥梁。Elasticsearch 8.16推出的BBQ技术(更优二进制量化)通过创新压缩方法,在保持高检索质量的同时,将内存用量降低95%,成本缩减至原5%。这项突破性技术解决了传统向量检索面临的高内存消耗(如2亿数据需1TB内存)问题,使大规模向量存储变得经济可行,为AI应用提供了高效可扩展的解决方案。

Agentic Reasoning 框架通过动态调用外部搜索、代码执行和结构化记忆工具,为大语言模型注入了“外部大脑”。这种方法不仅克服了传统内部推理的局限,还实现了多步、跨领域的深度逻辑推理。随着不断完善和扩展,这一框架有望在推动智能系统向专家级决策、深度研究和跨模态分析方向发展上发挥关键作用。

多个不同的角色的Agent,共同完成一份复杂的工作。由一个统筹管理的智能体,自主规划多个智能体分别做什么,以及执行的顺序。agent 应该包含的属性执行特定任务根据其角色和目标做出决策能够使用工具来实现目标与其他代理沟通和协作保留互动记忆在允许的情况下委派任务如何协作是关键条件自主:通过编码,顺序执行。高度自主:能够自行决定不同角色Agent的是否要执行,以及执行顺序。主要关注的点:1、自主性2、

前两周深度调研来MCP,也深度的体验了MCP(这篇文章整理里详细的资料)。一个本质问题,MCP实际上在构建function call的参数。世纪感受下来,虽然MCPserver非常多,但是实际使用起来一言难进,感觉都是完整度在10%-30%的半成品。此外即使配合claude使用这些工具也挺难用的。

BGE系列核心技术报告包括BGE(v1/v1.5)和BGE-M3两篇论文。BGE-M3创新性地提出统一模型解决多语言、多功能、多粒度检索问题,支持100+语言、8192token输入,能同时输出稠密、稀疏和多向量三种表示。关键技术包括位置重训、大batch训练和自知识蒸馏,在MIRACL、MKQA等评测中全面领先。该模型显著简化了现有检索系统架构,但极长文档处理仍有提升空间。相关论文可在arXiv
文本向量模型技术报告摘要 本报告对比分析2025年主流向量模型(BGE-M3、Qwen3-Embedding、Jina-v3/v4)的技术特性与性能表现。关键发现: 技术路线:BGE-M3采用经典Encoder优化,Qwen3基于生成式架构改造,Jina支持可变维度与Late-Chunking 长文本处理:实验显示8k切块+10%重叠+两阶段召回方案在精度(nDCG@10 0.768)与成本(显存

现在是北京时间2023年11月18日。聊一聊搜索。说到搜索,大家首先想到的肯定是谷歌,百度。我把这些定义成上一个时代的搜索引擎。ChatGPT已经火热了有一年的时间了,大家都认为Ai搜索是下一代的搜索。但是AI搜索,需要的是很大算力,需要很大存储空间。至今为止又有多少个公司能够真的去做AI搜索呢?普通的公司又能够做什么呢?ChatGPT是大模型,它的数据总是停留在历史的某个时间点上,目前来看,它对

我的环境是mac m2 32G ,没办法用GPU。这是X inference的安装教程。这里是mac部署2B的教程。还有测试推理的效果,速度

BGE系列核心技术报告包括BGE(v1/v1.5)和BGE-M3两篇论文。BGE-M3创新性地提出统一模型解决多语言、多功能、多粒度检索问题,支持100+语言、8192token输入,能同时输出稠密、稀疏和多向量三种表示。关键技术包括位置重训、大batch训练和自知识蒸馏,在MIRACL、MKQA等评测中全面领先。该模型显著简化了现有检索系统架构,但极长文档处理仍有提升空间。相关论文可在arXiv







