logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【AI应用】RAG文本切分策略

但根据LangChain的分割逻辑2,某段Chunk Size仍有可能超过设置的长度。直接语义切分有几个问题:每块长度不平均,单块太长会出现超出Max Token的风险。基于不同的文件类型使用不同的切分方法(如PDF、Python、Markdown)。文本切分的两个基本参数:Chunk Size(块大小)、Overlap(重叠)。解释:其中如果每个分割的大小较大,则会递归分割,直到分至目标长度。总

文章图片
#人工智能
【昇腾】Benchmark

输出token数不会因为结束符而停止。可以根据真实场景的输出更好的测试性能。生成的数据为A[空格],如输入token数为5: “A A A A A”测试环境:910B、四卡、DeepSeek-R1-Qwen-32B。device用于挂载卡,下面的例子是挂载了8张卡。可以指定输入输出的token数量。倒数第二行的镜像名称记得修改。合成数据配置路径使用**

文章图片
#昇腾
【实时更新】大模型发布时间轴

地址:https://chongwenz.cn/llm-timeline/实时更新最新发布的大模型情况。

【10 天 AI 协作开发实录】一份可复用的 AI 开发流程样例

我用 10 天时间,借助多个 `AI` 模型和工具,完成一个项目的需求分析、产品设计、架构设计、数据库设计以及前后端开发。

#人工智能
【开发便利】让远程Linux服务器能够访问内网git仓库

开发主力是一台云端的 Linux 服务器,代码却存放在无法被公网访问的公司内网 Git 仓库中。本文利用 Windows 电脑作为“网络桥梁”,搭建一条能自动重连的 SSH 隧道,解决远程开发中的网络隔离问题。利用 Windows 电脑作为跳板,建立一个从它到远程 Linux 服务器的。当远程服务器访问自己的某个端口时,流量会被加密传输回你的 Windows 电脑,再由你的电脑转发至内网的 Git

#服务器#linux#git
【昇腾】Benchmark

输出token数不会因为结束符而停止。可以根据真实场景的输出更好的测试性能。生成的数据为A[空格],如输入token数为5: “A A A A A”测试环境:910B、四卡、DeepSeek-R1-Qwen-32B。device用于挂载卡,下面的例子是挂载了8张卡。可以指定输入输出的token数量。倒数第二行的镜像名称记得修改。合成数据配置路径使用**

文章图片
#昇腾
AI编程任务管理新思路:Vibe Kanban 体验

发现一个有意思的。它主打的是"任务流程 + 多代理协同",而不是单纯的聊天式编程。用法很简单,只需要执行即可启动。

文章图片
AI编程任务管理新思路:Vibe Kanban 体验

发现一个有意思的。它主打的是"任务流程 + 多代理协同",而不是单纯的聊天式编程。用法很简单,只需要执行即可启动。

文章图片
AI编程任务管理新思路:Vibe Kanban 体验

发现一个有意思的。它主打的是"任务流程 + 多代理协同",而不是单纯的聊天式编程。用法很简单,只需要执行即可启动。

文章图片
    共 29 条
  • 1
  • 2
  • 3
  • 请选择