logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

语音识别大模型原理

这标志着音频AI从“专用工具”向“通用智能体”的深刻转变。

#语音识别#人工智能
如何写出专业视频生成 AI 提示词:从零到实战工具

专业视频AI提示词生成指南 本文提供了一套系统化的方法,帮助用户从零开始构建专业级视频生成AI提示词。主要内容包括: 目标与风格设定:强调使用专业术语描述镜头类型、运镜方式和场景元素,避免模糊形容词。 后期处理术语:介绍专业后期效果的关键词,如色彩调节、光效氛围等。 镜头叙事技巧:讲解如何通过运镜方式增强故事性和情绪表达。 结构化模板:提供标准化的提示词构建框架,包含12个关键维度。 自动化工具:

#人工智能#音视频
生成式人工智能(Generative AI)

摘要: 生成式人工智能(Generative AI)是能自主创造文本、图像、音频等内容的技术,基于Transformer、扩散模型等架构,如ChatGPT、Midjourney和Sora。与传统判别式AI不同,它通过分析数据模式生成全新内容,已广泛应用于创意领域。2025年,模型如GPT-5和Grok 4展现出接近通用人工智能的能力,但也面临伪造、版权等挑战,正重塑人类创作方式。

#人工智能
大模型(像 ChatGPT、Claude、Gemini 之类)响应结果每次可能不一致

大模型不是一个固定的“程序输出”,而是一个带随机性的“概率分布采样器”。如果需要。

dify 中的代码执行拆成多个迭代

【代码】dify 中的代码执行拆成多个迭代。

#java#前端#linux
常见、主流、可靠的机器学习与深度学习训练集网站

机器学习与深度学习数据集资源概览 本文整理了主流可靠的训练集资源,按任务类型分类: 综合平台:Kaggle、Google Dataset Search、Hugging Face等提供跨领域数据集 图像处理:ImageNet、COCO等经典CV数据集 文本/NLP:Hugging Face、Wikipedia语料等自然语言处理资源 语音/视频:LibriSpeech、Kinetics等音频视频专用数

#机器学习#深度学习#人工智能
Weaviate 介绍(向量数据库)

Weaviate 是一个开源的 AI 原生向量数据库,专为大规模向量搜索和 AI 应用设计。它支持多种搜索方式(纯向量、语义和混合搜索),提供 RAG、AI 代理等功能,并可通过 SDK(Python/Go/JS)或 API(GraphQL/REST)访问。安装方式灵活:Docker 适合本地开发,Kubernetes 适配生产环境,Embedded 模式可嵌入应用,Cloud 服务提供托管方案。

#数据库
训练 Gemini 这样的大模型需要哪些?

摘要:训练Google Gemini这类超大规模多模态模型需要天文数字级的硬件资源。Google使用自研TPU v4/v5p芯片集群,通过光电路交换机构建超级计算机;行业通用方案则依赖NVIDIA H100/A100 GPU,需搭配NVLink和InfiniBand高速互联。训练Gemini Ultra需上万张加速卡,耗时数月,耗资数千万美元;微调阶段需8-64张GPU,推理则需8+张H100运行

ai json处理提示词

"解析以下复杂的JSON,提取所有`user`对象的`name`和`email`:"- "请解析以下JSON,并返回`user.address.city`的值:"- "从以下JSON数组中提取`status`为`active`的所有对象:"- "解析以下JSON,提取`user.profile.email`的值:"- "从多层嵌套的JSON中提取所有`product`的名称和价格:"- "生成一个

文章图片
#人工智能
微信小程序中调用阿里云 OSS(Object Storage Service)上传文件

阿里云官方提供了一个适用于小程序的 OSS SDK:[aliosswxsdk](https://github.com/alisdk/aliosswxsdk)。url: 'https://yourbucketname.osscnhangzhou.aliyuncs.com', // OSS 上传地址。OSSAccessKeyId: 'youraccesskeyid', // 从后端获取的 Access

文章图片
#微信小程序#阿里云
    共 190 条
  • 1
  • 2
  • 3
  • 19
  • 请选择