黑金IT 个人主页

@ylong52

黑金IT

2024-08-18 11:04:33 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

从CUDA爆显存到单卡跑Llama3-70B：一个算法工程师的LoRA自救笔记

LoRA（Low Rank Adaptation）即低秩自适应，核心是解决大模型全参微调的高成本问题。传统全参微调需更新模型所有参数（数十亿甚至数百亿），显存和算力消耗巨大。LoRA 通过冻结基座模型权重，仅在旁侧添加低秩分解的小参数模块（Adapter）进行训练，大幅降低微调门槛，实现 “极低投入改造模型”。

#算法

Open WebUI官方库：解锁人工智能服务的官方通道

Open WebUI 是一个开源项目，它提供了一个基于 Web 的用户界面，用于管理和操作各种本地和云端的人工智能模型。这个界面让用户可以方便地加载、配置、运行和监控各种 AI 模型，而无需编写代码或使用命令行界面。它支持多种大型语言模型（LLM），包括与 Ollama 和 OpenAI 兼容的 API。

#python #github

如何通过提示词减少AICG费片的痛点

本文提出针对AIGC视频生成领域的"费片率"问题，设计了一套专用的五维评分量规系统。该系统从可视化性、物理逻辑、镜头语言、主体一致性和安全性五个维度，对视频生成脚本进行预审评估。通过具体案例分析，展示了高质量与低质量脚本的特征差异，并提供了可集成到后端的JSON格式Prompt模板。该方案能有效识别高风险脚本，自动提供优化建议，从而降低废片率，节省算力成本。核心价值在于将通用文

#人工智能

LLM 裁判（LLM-as-a-judge）

摘要： LLM裁判（LLM-as-a-judge）利用大语言模型评估其他AI生成内容的质量，核心采用五维评分量规：准确性（事实正确性）、相关性（指令遵循）、逻辑性（结构连贯）、完整性（信息覆盖）和流畅性（语言表达）。该方法结合语义理解与规模化优势，优于传统指标（如BLEU）和人工评估，但需警惕位置偏见、长度偏见和模型自我偏好。通过标准化Prompt（如JSON输出格式）和交叉验证可提升评测可靠性，

#人工智能

通过 JS 注入修改部分浏览器指纹信息

本文介绍了通过JS注入修改浏览器指纹信息的方法。主要可修改项包括：1) User-Agent和平台信息；2) 屏幕分辨率、颜色深度等显示属性；3) 时区和语言设置；4) Canvas指纹（添加噪声或修改渲染）；5) WebGL渲染器信息；6) 字体列表检测结果；7) 插件和MIME类型；8) 硬件配置（CPU核心数、内存）；9) 电池状态；10) WebRTC IP泄漏防护。这些技术通过重写浏览器

#javascript #开发语言 #ecmascript

Selenium Wire 网络拦截实现方案

本文介绍了在Robot Framework中集成Selenium Wire实现网络请求拦截的方案。主要内容包括：通过Chrome调试模式接管已登录浏览器；创建自定义库实现请求拦截、分析和修改功能；提供浏览器启动脚本和示例测试用例；说明技术架构和使用流程。该方案支持获取请求/响应详情、按条件过滤请求、设置拦截器等核心功能，并提醒注意调试模式独占性、HTTPS证书信任等问题，为自动化测试中的网络监控提

#自动化

用 AI 拆电影：TransNet V2 + FFmpeg 提取最美镜头一帧图

让 AI 先拆镜头，再捞中间帧，FFmpeg 负责精准定位，脚本负责快快快——整条管线开源、零许可费，10 分钟搭完，90 分钟片子 30 秒收工，干净又高效。镜头 1 独占 0–120 帧，镜头 2 独占 121–345 帧……中间“消失”的帧就是 AI 判定的转场区，直接丢掉别心疼。例子：121 ~ 345 → 233 帧，离两侧边界最远，最不容易带重影。：先让 AI 画出镜头边界，再跳到“安

#人工智能

微信视频号直播间弹幕抓取工具技术文档

微信视频号直播间弹幕抓取工具技术摘要本项目开发了一款基于Electron框架的微信视频号直播间数据采集工具，采用分层架构设计，包含数据采集层、业务逻辑层和用户界面层。核心功能包括：通过Chrome DevTools协议实时捕获直播间弹幕、礼物等互动数据采用WebSocket连接实现毫秒级响应模块化设计包含监听服务、数据转发和界面展示三大模块支持数据解析、过滤和HTTP转发至外部服务器提

#微信

3 分钟部署分布式 TTS 系统！IndexTTS2 一键启动，GPU 成本省七成

IndexTTS2分布式语音合成系统为企业级应用提供高效解决方案，解决传统TTS面临的三大痛点：商业API成本高、本地部署复杂、资源利用率低。该系统基于RabbitMQ实现弹性分布式架构，支持动态扩容和智能资源管理，通过Docker实现一键部署。核心优势包括：情感丰富的语音合成能力、自动开关机节省成本、消息队列稳定处理高并发任务。适用于视频配音、数字人等场景，开发者可通过简单命令快速搭建私有语音工

Robot Framework Log关键字：实时日志输出的强大力量

Robot Framework的Log关键字通过实时日志输出显著提升了测试效率。其核心优势包括：1) 即时反馈机制，测试执行中即可查看日志；2) 灵活的日志级别控制(INFO/DEBUG/WARN/ERROR)；3) 强大的格式化能力，支持变量和表达式；4) 深度集成测试流程。在网络请求捕获、API测试、数据库操作等场景中，Log关键字的实时性能帮助测试人员快速发现问题，实现"所见即所得

#自动化

共 37 条

请选择