logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

数据分析软件Power BI探索数据教程(六)——如何获取更多仪表盘空间

Power BI是基于云的商业数据分析和共享工具,它能帮您把复杂的数据转化成最简洁的视图。通过它,您可以快速创建丰富的可视化交互式报告,即使在外也能用手机端 APP 随时查看。甚至检测公司各项业务的运行状况,只需它仪表板的一个界面就够了。Power BI服务是 Power BI Deskt...

#数据库#操作系统
《柳叶刀》:人工智能可识别九类急性脑CT异常

  在新的研究中,人工智能深度学习算法能够准确识别头部CT扫描中9种不同程度的异常。  研究人员从印度20家医院门诊放射中心,收集了超过313000张匿名患者的头部CT扫描影像来训练其算法,并随机选择9000多名患者的21000个扫描样本验证算法。结果显示算法能够准确识别头部CT扫描中9种不同的严重异常。  这项由印度Qure.ai公司资助,题为《Deep learning ...

#人工智能
告别手动转换!用Python脚本一键将Labelme关键点标注转为YOLO格式(附完整代码)

本文介绍了一个高效的Python脚本,可将Labelme生成的关键点标注一键转换为YOLO格式,解决手动转换耗时且易出错的问题。脚本支持批量处理、坐标归一化和关键点可见性处理,大幅提升计算机视觉项目的数据标注效率。附完整代码和实用扩展功能。

ROS 2 pre-release binaries 安全接入与生产级验证指南

pre-release binaries(预发布二进制包)是现代机器人中间件质量保障的关键环节,其本质是在正式发布前通过真实部署环境暴露集成风险。它基于分层发布机制(building → ros-testing → main),依托APT源管理、二进制归档、Docker镜像等技术路径,实现对ABI兼容性、依赖连通性及运行时稳定性的前置验证。相比源码编译,pre-release binaries能真

Kilted Kaiju:用可量化纹章学解构权威视觉语法

在数字内容创作中,‘权威形象’并非天然存在,而是由可测量的视觉参数系统性构建——从制服纹样的色相精度、褶裥物理形变率,到布料材质的光学响应特性。这类基于符号学与工程约束的视觉语法,正成为品牌设计、IP开发与AI生成内容可信度调控的关键底层能力。本文以苏格兰短裙(kilt)的七维纹章参数体系和怪兽(kaiju)的非欧几里得骨架为双轴,揭示如何将文化符号转化为可编程、可验证、可迭代的视觉控制变量。其方

告别“看图猜物”:DeepLabv3+中的空洞卷积(Atrous Conv)如何让图像分割更精准?

本文深入解析了DeepLabv3+中的空洞卷积(Atrous Conv)技术如何显著提升图像分割精度。通过保持特征图分辨率并扩展感受野,该技术解决了传统卷积神经网络的空间信息衰减问题,在PASCAL VOC等数据集上实现89%的mIOU精度。文章详细介绍了空洞卷积的工作原理、DeepLabv3+的工程实现及其在医疗影像、自动驾驶等领域的跨领域应用。

#计算机视觉
LlamaIndex中LLM与嵌入模型的职责分离与协同实践

在RAG系统中,大语言模型(LLM)与嵌入模型并非功能等价组件,而是分别承担语义理解与语言生成两大基础任务的技术角色。嵌入模型本质是文本到向量空间的坐标翻译器,其输出质量直接决定检索精度;LLM则负责查询重写、上下文整合与答案生成,对幻觉抑制与指令遵循能力要求更高。二者存在隐式耦合风险,如提示词污染、tokenizer不一致、大小写敏感冲突等,需通过解耦设计(如EmbeddingRouter)、统

基于ElevenLabs API的AI助手语音合成集成实践

语音合成技术作为人机交互的重要分支,其核心原理是将文本信息转化为自然流畅的语音输出。通过深度学习模型对语音特征进行建模,该技术能够模拟人类语调、节奏和情感变化,从而提升信息传递的效率和体验。在工程实践中,高质量的语音合成能够显著降低用户认知负荷,尤其适用于代码审查、文档播报、数据分析结果同步等需要长时间专注的工作场景。本文以ElevenLabs流式TTS API为例,深入探讨了如何将语音合成能力无

#AI助手
EmblemAI:为AI智能体赋予原生跨链金融操作能力

在区块链与人工智能融合的浪潮中,AI智能体(AI Agent)正成为自动化策略执行的关键角色。其核心原理在于通过智能合约与链上数据交互,实现自主决策与资产操作。这一技术的核心价值在于将AI的分析推理能力与区块链的可信执行环境结合,创造出无需人工干预的自动化金融代理。应用场景广泛覆盖量化交易、DeFi策略执行、跨链资产管理及市场监控等领域。然而,传统开发模式面临集成多链SDK、管理私钥安全及处理复杂

#AI智能体
Gemini 3.1 Pro与GPT-5.4横向评测:成本效益颠覆认知,AI模型选型实战指南

大语言模型(LLM)通过海量数据训练,掌握了强大的语言理解和生成能力,其核心原理在于Transformer架构对上下文信息的并行化注意力处理。这项技术的价值在于能够将非结构化信息转化为结构化知识,并自动化处理复杂的认知任务,从而显著提升内容创作、代码编程和数据分析等场景的效率。在实际工程应用中,开发者面临的核心挑战之一是如何在模型性能与使用成本之间取得平衡。本次评测聚焦于谷歌Gemini 3.1

    共 54 条
  • 1
  • 2
  • 3
  • 6
  • 请选择