logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

LiteLLM:让LLM调用变得简单统一

LiteLLM是一个统一接口工具,支持调用100多种大型语言模型(如OpenAI、Azure、Anthropic等),简化了不同模型间的开发差异。其核心功能包括:1)标准化调用接口,兼容多种模型;2)支持流式响应和函数调用;3)提供代理服务器简化部署;4)集成LangChain等框架;5)具备模型路由和故障转移能力;6)内置成本监控和日志跟踪。适用于聊天机器人、内容生成等AI应用开发,显著提升开发

文章图片
#flask#python#后端
记录豆包的系统提示词

摘要:本文介绍了豆包AI系统的互动规则与能力说明,包含七大类规范要求:1)知识类问题需详尽回答并规范排版;2)文案创作需满足用户潜在需求;3)翻译任务遵循"准确简洁场景化"原则;4)医学问题需严格遵循医疗规范;5)用户投诉处理需保持中立合规;6)系统具备文档处理、绘图、搜索和计算等核心功能;7)知识库截止至2024年5月,后续信息不作确认。全文采用Markdown格式,突出关键

文章图片
#python
DDIA第一章:吃透数据系统架构的核心逻辑

我们常说“数据驱动业务”,但首先要分清两类核心应用:计算密集型和数据密集型,两者的核心挑战天差地别。计算密集型:核心瓶颈是算力,比如AI训练、科学计算,拼的是CPU/GPU性能;数据密集型:核心瓶颈是数据本身,比如电商、社交、支付系统,核心挑战是存储海量数据、保障数据一致性、应对高并发读写、实现系统高可用。数据库:持久化存储数据,保证后续可检索;缓存:记住昂贵操作结果,加速高频读取;搜索索引:支持

#系统架构
DDIA第一章:吃透数据系统架构的核心逻辑

我们常说“数据驱动业务”,但首先要分清两类核心应用:计算密集型和数据密集型,两者的核心挑战天差地别。计算密集型:核心瓶颈是算力,比如AI训练、科学计算,拼的是CPU/GPU性能;数据密集型:核心瓶颈是数据本身,比如电商、社交、支付系统,核心挑战是存储海量数据、保障数据一致性、应对高并发读写、实现系统高可用。数据库:持久化存储数据,保证后续可检索;缓存:记住昂贵操作结果,加速高频读取;搜索索引:支持

#系统架构
Chroma 开源的 AI 应用搜索与检索数据库(即向量数据库)

Chroma是一款开源AI向量数据库,支持Python和JavaScript快速构建带记忆功能的LLM应用,核心API仅4个函数,操作简洁。它具备简单易用、多工具集成、多场景支持等特性,提供本地部署和Chroma Cloud托管服务(含30秒创建数据库和5美元免费额度)。默认使用Sentence Transformers生成嵌入向量,也支持OpenAI、Cohere及自定义嵌入,适用于"

文章图片
#开源#人工智能#数据库
ClaudeCode中使用DeepSeek API

DeepSeek API 新增了对 Anthropic API 格式的支持,允许用户通过简单配置将 DeepSeek 模型接入 Anthropic 生态系统。主要使用场景包括将 DeepSeek 模型接入 Claude Code 或通过 Anthropic SDK 调用 DeepSeek 模型。API 兼容性方面,支持基础参数如 max_tokens、system、stream 等,并部分支持工具

#python
在第三方 Coding Agent 中使用 | Kimi For Coding

本文介绍了两种集成 Kimi For Coding AI模型的方法:Claude Code和Roo Code。对于Claude Code,详细说明了macOS/Linux和Windows系统的安装步骤,包括Node.js环境配置和初始化设置,并指导如何通过环境变量配置Kimi模型。对于Roo Code,则介绍了VS Code扩展的安装流程,以及如何设置OpenAI兼容接口来连接Kimi For C

#python
Python Kùzu:高效嵌入式图数据库指南

Kùzu(Kuzu)是一个嵌入式图数据库,专为Python生态中的高性能图查询和分析设计。它支持属性图模型、ACID事务和Cypher查询语法,并具备向量搜索功能。作为嵌入式数据库,Kùzu无需单独部署,可直接集成到应用中。其核心优势包括高性能图分析、混合图与向量查询能力、多语言支持和ACID事务保证。适用于知识图谱、语义检索、推荐系统等场景,但存在内存消耗较大、生态尚不成熟等局限。Python中

文章图片
#python#数据库#开发语言
【AI】Agno框架:多代理智能体快速上手指南

Agno是一个高性能的多智能体框架,集成了运行时环境和UI界面,用于构建具备记忆、知识检索、工具调用和人机交互能力的智能体系统。其核心设计强调高性能(微秒级实例化)、模型无关性(支持多模态输入输出和任意模型提供商)以及模块化组合(工具、记忆、知识等组件可插拔)。Agno支持将多个智能体组织为团队或工作流,通过AgentOS运行时实现私有化部署和可视化监控。典型应用场景包括检索增强生成(RAG)、复

文章图片
#人工智能
豆包手机AI Agent技术深度解析

本章节深入剖析豆包手机AI Agent的技术实现细节,从系统进程、权限管理到推理架构,揭示了移动端AI自动化操作的核心机制。通过对autoaction、aikernel等关键进程的分析,我们了解到豆包手机如何通过底层系统权限实现屏幕读取、事件注入等高级功能,并探讨了云端与本地推理的分工模式。本章内容对理解移动AI架构、系统安全设计及自动化工具开发具有重要价值,为开发者提供了系统级AI应用的实战参考

#人工智能
    共 73 条
  • 1
  • 2
  • 3
  • 8
  • 请选择