logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Dify+Ollama+QwQ:3步本地部署,开启AI搜索新篇章

接下来我们就尝试跟随来部署本地的价值所在!

文章图片
#人工智能#自动化
[特殊字符] TTS格局重塑!B站推出Index-TTS,速度、音质、情感表达全维度领先

中文中大量存在多音字(如“长”可读作“zhǎng”或“cháng”),其正确发音高度依赖上下文,传统TTS系统常因语义理解不足而误读,影响语音自然度与可懂度。(卷积增强型 Transformer)作为骨干网络,融合卷积层的局部感知能力与自注意力机制的长程依赖建模优势,能够高效捕捉语音信号在时间与频域上的复杂特征,为高质量语音合成奠定基础。若已标注,则优先采用用户指定发音,兼顾自动化与精准控制。:将

文章图片
#人工智能#音视频#python
三步封神!Dify 工作流秒变智能插件,MCP Server 实战全攻略

接下来我们将重点讲解如何构造插件所需的Schema数据结构,这是一段标准的 JSON 格式,用于描述你希望对外暴露的功能。

文章图片
#自动化#人工智能
AI on Mac, Your Way!全本地化智能代理,隐私与性能兼得

2025 年 AI Agent 全面爆发,macOS 阵营杀出一匹黑马——开源新锐 Cua,让果粉也沸腾!由 trycua 团队开发的 Cua,是一款专为 macOS 打造的开源 AI Agent 框架,正重新定义计算机自动化操作的边界。它基于 Apple 原生的 Virtualization.Framework 构建,充分利用 Apple Silicon 芯片的高性能架构,支持在本地高效创建和运

文章图片
#人工智能#macos
iPhone 智能进化:Siri 调用 DeepSeek 大模型

借助 Siri 的快捷指令功能,连接至 DeepSeek 的开放 API 接口。只需通过语音唤醒 Siri 并说出关键字 “DeepSeek”,即可直接调用 DeepSeek 官方的大模型。如果没有,可以在 App Store 中搜索并下载“快捷指令”应用。在“运行 Siri 指令”操作的配置界面中,输入你想要通过 Siri 说出的关键字,例如“DeepSeek”。在搜索框中输入“Siri”,找到

文章图片
#iphone#ios#语言模型
本地部署的终极多面手:Qwen2.5-Omni-3B,视频剪、音频混、图像生、文本写全搞定

综上所述,Qwen2.5-Omni-3B 凭借其轻量高效、多模态融合与长上下文理解等优势,已在多个垂直领域展现出广泛的应用前景,助力智能化服务的快速部署与创新落地。

文章图片
#音视频#人工智能
忘掉重启?不存在!LangGraph 与 PostgreSQL 联手给 AI 装上永生记忆

1.3 Conditional Edge —— 让流程「带脑子」• 作用:根据 State 中的某个字段值,在运行时动态选择下一步节点,实现非线性、递归甚至循环逻辑。• 典型写法:```pythonelse:```LangGraph 会把 routing_fn 的返回值(节点名)作为下一步要调度的节点。• 收益:– 减少硬编码 if/else,逻辑集中在一处。– 同一套图可服务多种业务场景(客服、

文章图片
#人工智能
TTS革命来了!Hugging Face榜首开源模型,CPU跑出GPU级体验

2025 年 10 月,Neuphonic 把 NeuTTS Air 带到大家面前:一台普通笔记本、一部手机,甚至树莓派,就能在本地“开口说话”。它开源、Apache 2.0 授权,不碰云端、不上传数据,把语音 AI 的门槛直接砍到地板。轻量语言模型配全新音频编解码器,实时合成自然人声,让嵌入式小助手、隐私敏感工具都能零成本拥有广播级嗓音。

文章图片
#人工智能
2025 全球音乐 AI 大模型对决:技术革新引领商业变革浪潮

无论是旋律的诞生,还是工业化编曲的流程,AI 大模型都在以飞快的速度改变着行业的基本逻辑架构。在中国,昆仑万维依靠 Mureka 系列产品在技术领域登上了顶尖位置,与此同时,国际巨头 Suno 却陷入了版权争议的困境之中,这深刻地揭示出技术、商业以及伦理之间错综复杂的博弈关系。作为国际知名的AI作曲工具,擅长交响乐和影视配乐领域,但在生成灵活性和多样性方面表现相对有限,难以满足复杂或个性化的创作需

文章图片
#人工智能
RAG的视觉知识之旅:图像也能加入知识库啦!

它不仅支持**长上下文嵌入**(最高可达8192个token),能够更完整地保留复杂文档的语义结构,还首次引入了**多模态嵌入能力**,可统一处理文本与图像内容,实现跨模态的语义对齐与联合检索。本次测试中,我们将它与 **Gemini Flash 2.5** 结合,构建一个增强型的 RAG 系统,探索其在复杂查询理解、多模态内容处理以及长上下文场景下的实际表现。通过计算问题嵌入与图像嵌入之间的语义

文章图片
#科技#人工智能
    共 130 条
  • 1
  • 2
  • 3
  • 13
  • 请选择