gogoMark 个人主页

@gogoMark

gogoMark

2024-09-11 16:33:14 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

ChatGPT 突然卖货了：从话痨 AI 变超级导购，这波操作到底多野

2025 年 4 月 29 日，OpenAI 突然宣布给 ChatGPT 加了个购物模块，直接让这个原本只会说车轱辘话的 AI，摇身一变成了全网最懂你的导购机器人。简单来说，现在你可以在 ChatGPT 里直接搜商品，比如输入 “帮我找一双透气的跑步鞋，预算 500 元”，它会立刻给你推荐一堆鞋子，附带价格、用户评价和购买链接。更绝的是，付费用户还能开启 “记忆模式”，它会记住你之前聊过的东西，比

#人工智能

口播视频怎么剪！利用AI提高口播视频剪辑效率并增强”网感”

通过上述步骤，创作者可大幅提升剪辑效率，同时利用AI的自动化处理与创意功能增强视频的"网感"，实现播放量突破。需注意不同工具的功能差异，建议组合使用以发挥最大效益。

#人工智能 #音视频

MuseTalk做数字人：从“小白”到“高手”，我总结了这5步+3个调试秘诀

去年，我用MuseTalk做了第一个数字人——一个“邻家阿姨”形象的美食博主。结果发出去的视频，评论区全是：“这阿姨说话像机器人”“表情太僵了，看着难受”。后来我才发现：。从选风格到调表情，从配动作到优化语音，每一步都藏着“坑”。今天，我把这半年的踩坑经验总结成，帮你避开“效果翻车”，做出“像真人一样自然”的数字人。

#人工智能

解锁 FramePack 超强性能：实用优化指南（深度向）

尽管 FramePack 支持 6GB 显存的基础运行，但硬件升级带来的性能提升立竿见影。以 NVIDIA GeForce RTX 40 系列为例，其突破性的显存带宽和 CUDA 核心架构，可将单帧生成速度提升至 1.5 秒 / 帧（RTX 4090 实测数据）。在处理 1080P/30fps、60 秒的复杂场景视频时，相比 RTX 3060，渲染时间可缩短 60% 以上。建议内容创作者优先选择

#人工智能 #深度学习

B 站 IndexTTS2 开源，AI 终于学会 “演” 声音了

去年还在吐槽 AI 配音 “像机器人读课文”，今年就被 B 站的 IndexTTS2 狠狠打脸 —— 一段误传为 “泄露” 的《甄嬛传》配音 Demo，让 Reddit 网友集体惊呼 “这情绪细腻到不像 AI”；如今模型正式开源，不仅能精准控制语音时长、分开调节音色与情绪，甚至能用自然语言指令让 AI “演” 出愤怒、委屈、惊喜，直接把文本转语音（TTS）从 “朗读工具” 升级成了 “声音演员”。

#人工智能

B 站 IndexTTS2：让《甄嬛传》说流利美音，AI 配音终于能 “演” 跨语言戏了

当 “臣妾做不到啊” 这句经典台词，用皇后的原声语调说出流利英文时，不少网友惊呼 “AI 配音终于打破语言壁垒了”。B 站自研的 IndexTTS2 模型，不仅能精准克隆角色音色、还原细腻情绪，更凭借 “跨语言配音 + 毫秒级时长控制”，让《甄嬛传》《让子弹飞》等国产影视片段轻松实现 “原声质感” 的英文配音，彻底颠覆了传统 AI 配音 “机械生硬”“音画错位” 的刻板印象。

#人工智能

AI 视频创作必学！世界观 / 角色 / 故事 / 风格四大设定拆解（附提示词模板）

你是不是经常看着别人用 AI 生成的动画短片惊叹不已，自己打开软件却只能对着空白界面发呆？想做 AI 视频却总卡在「不知道从哪下手」？90% 的新手都死在了「没搞懂底层逻辑」的第一步 ——。传统影视公司花 3 个月策划的剧本框架，用 AI 可以一键简化！今天带你用《哪吒》《三体》等经典案例拆解核心方法论，只需搞懂四大模块，就能像搭积木一样搭建影片内核，从此告别「软件操作工」式创作！

#人工智能

DeepSeek-OCR：重新定义文本压缩与多模态理解

在人工智能快速发展的浪潮中，DeepSeek团队再次带来突破性创新。最新开源的DeepSeek-OCR模型不仅颠覆了传统OCR技术的边界，更提出了"视觉即压缩"的革命性理念，为多模态大模型的发展开辟了全新方向。

FramePack 问世：6G 显存笔记本也能生成 1 分钟高清视频！AI 影视加速器来了

过去三年，AI 视频生成始终困在 “15 秒魔咒” 中。就像用吸管喝珍珠奶茶，生成时间越长，要么算力爆炸（显存不足），要么画面崩坏（人物变形）。斯坦福团队发现的 “遗忘 - 漂移困境” 正是症结所在 —— 模型既要记住前情提要，又要避免误差累积，这好比要求导演同时记住 3000 个分镜脚本。

#人工智能 #音视频

用Coze工作流3分钟生成爆款短视频，新手日更30条不是梦！

通过该工作流，可快速生成60-80分质量的混剪视频，配合人工精选优化后可达优质内容水平。需注意定期更新素材库与优化提示词模板以保持内容竞争力。无需写脚本、不用学剪辑、告别素材焦虑，通过Coze工作流搭建的‘爆款生成器’，输入1个关键词即可全自动输出成片。“为什么别人的账号每天能发50条原创视频？为什么百万播放的爆款总带着相似的‘流水线质感’？✅ 大模型编剧 × 智能素材库 × 语音克隆 × 剪映自

#音视频 #人工智能

共 78 条

请选择