
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文介绍如何使用开源 LLM 工程平台 Langfuse 对 GenAI 应用进行可观测性实践,涵盖追踪(Tracing)、Prompt 管理、评分(Scoring)和评估(Evaluation)等核心环节。

本文对比评测了Qwen3-4B和Qwen3.5-4B模型在AWS SageMaker上的部署表现。Qwen3.5-4B采用Hybrid架构(Gated DeltaNet+Attention),相比标准Transformer的Qwen3-4B具有更好的长文本处理能力,但增加了8.8GB的模型体积和推理复杂度。通过AgentScope框架构建评测系统,包含任务定义、评分指标和Agent解题逻辑。
AWS Elastic Beanstalk 将在2026年初推出AI驱动的日志健康分析功能,通过eb logs --analyze命令自动收集环境日志和元数据,利用Amazon Bedrock上的Anthropic Claude模型生成结构化故障诊断报告。系统会收集平台引擎日志、部署钩子日志、应用标准输出/错误日志等6类关键日志文件,并结合环境健康状态和事件时间线等元数据进行分析。

本文介绍了一种基于Arthas和AI Agent的Java应用智能诊断系统。系统通过Arthas MCP协议连接AI工具,实现自动化问题定位与分析。核心架构包含Python进程管理、AI诊断层、MCP客户端和Arthas服务层,支持6类常见故障场景。文章详细展示了CPU高利用率案例的诊断流程:通过dashboard和thread命令定位到问题线程,结合反编译代码分析出无限循环导致CPU飙升的根因。

上节课我们聊了词向量表示,像Word2Vec这样的模型,它确实能捕捉到词语之间的语义关系,但问题在于,它本质上还是在孤立地看待每个词。英文的“Apple”,可以指苹果公司,也可以指水果。这种一词多义的特性,以及词语在上下文中的微妙变化,Word2Vec这种固定向量的表示方式就捉襟见肘了。而且,它还不能处理新词,一旦遇到词表里没有的词,就束手无策。所以,尽管有了词向量,NLP领域在很长一段时间内,也

AWS Elastic Beanstalk 将在2026年初推出AI驱动的日志健康分析功能,通过eb logs --analyze命令自动收集环境日志和元数据,利用Amazon Bedrock上的Anthropic Claude模型生成结构化故障诊断报告。系统会收集平台引擎日志、部署钩子日志、应用标准输出/错误日志等6类关键日志文件,并结合环境健康状态和事件时间线等元数据进行分析。

摘要: OCR技术经历了从传统字符识别到多模态理解的演进。传统OCR(1.0)依赖CNN+LSTM结构,仅能提取文本,而现代OCR 2.0(如DeepSeek-OCR、Qwen-VL)结合视觉Transformer和多模态对齐技术,可解析文档结构(表格、公式)并生成Markdown/JSON。DeepSeek-OCR创新性采用"上下文光学压缩"和端到端框架,平衡效率与精度,支持

AWS Network Flow Monitor是一个基于eBPF技术的网络监控服务,其核心组件nfm-agent部署在计算节点上采集TCP连接指标。该服务通过OTLP协议上报数据,但由于在中国区未部署后端服务,本文提出了一种替代方案:利用nfm-agent的eBPF采集能力,结合EMF格式将指标写入CloudWatch。方案通过Docker Compose部署三个组件:nfm-agent负责采集

OpenSandbox 是一个通用的沙箱运行环境,相比与AgentScope框架深度绑定的AgentScope-Runtime,它采用协议优先设计,通过独立的execd守护进程实现标准化OpenAPI接口。execd基于Go语言开发,动态注入到容器内部,作为沙箱代理处理代码执行、命令运行、文件操作和资源监控四大功能,支持多语言状态化执行和实时交互。使用时需先启动OpenSandbox服务端(基于F

本文基于Apache Flink Agents框架实现了实时情感分析工作流,使用本地LLM API处理文本流数据。Flink Agents将LLM推理能力嵌入分布式流处理管道,解决了传统AI批处理模式在扩展性、容错性、背压处理等方面的不足。文章详细对比了Flink Agents与传统脚本方式的优势,并提供了具体实现方案,包括数据模型定义、Prompt模板设计及本地LLM连接配置。测试版本为Flin








