logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Ollama Voice Mac: 本地离线语音助手的革新之作

Ollama Voice Mac是一个基于Mistral 7B大语言模型和Whisper语音识别模型的离线语音助手。该项目由开发者apeatling在GitHub上发布,旨在为Mac用户提供一个完全本地运行、无需联网的智能语音交互体验。完全离线运行,保护用户隐私基于强大的Mistral 7B模型,具备出色的语言理解和生成能力使用Whisper实现高质量的语音识别专为Mac平台优化,支持Apple

文章图片
#macos
万字长文梳理「罗福莉」三个半小时的访谈:2026年不是Agent元年,是生产力爆发年

更重要的是设计目标的差异:Claude Code的一切设计都是for软件工程的,session满了做压缩、根据plan做记忆、跨session共享context,这些都是为了"写好代码"。但我去用OpenClaw的时候,我不会关注模型的能力——因为我认为OpenClaw框架的设计之初,就是想尽量通过Agent的整套编排来弥补模型的短板。实际使用中,很多人对世界的感知力、情商、知识储备上,Omni反

文章图片
#人工智能
正规军进场!GEO效果无法评估的行业难题,终于破局了!

你怎么衡量花了钱、做了内容之后效果到底怎么样?扫码免费帮你做一份专属品牌 AI 能见度诊断报告,看看你的品牌在豆包、元宝、DeepSeek等6大AI平台上到底表现怎么样,跟竞品比是领先还是落后,A说的是好话还是坏话,一测便知。输入品牌词或品类词,选择要监测的 AI 平台(豆包、元宝、DeepSeek、千问、百度 AI、KIMI 六大主流平台全覆盖),系统会生成一份详细的能见度报告。当越来越多的人习

文章图片
#人工智能
273页财报、子Agent连续执行2小时,MiniMax M3在金融场景的表现如何?

现在灰色的海外中转基本无了,国产模型替代就很重要,我测试下来,M3的Coding能力跟Claude sonnet水平相当,日常写代码什么的完全够用,最重要的还是性价比吧,我用M3不会感觉心疼,但是大家日常去Coding的场景能力绝对是足够了。这个场景我用M3已经有段时间了,海外模型有天然的水土不服,M3给的分析就非常中肯,这是我觉得非常好的一点,再就是M3执行长任务我没想到会这么稳定,也算是个惊喜

文章图片
#人工智能
273页财报、子Agent连续执行2小时,MiniMax M3在金融场景的表现如何?

现在灰色的海外中转基本无了,国产模型替代就很重要,我测试下来,M3的Coding能力跟Claude sonnet水平相当,日常写代码什么的完全够用,最重要的还是性价比吧,我用M3不会感觉心疼,但是大家日常去Coding的场景能力绝对是足够了。这个场景我用M3已经有段时间了,海外模型有天然的水土不服,M3给的分析就非常中肯,这是我觉得非常好的一点,再就是M3执行长任务我没想到会这么稳定,也算是个惊喜

文章图片
#人工智能
深入探索TTS:一个强大的深度学习文本转语音工具包

TTS(Text-to-Speech)是由Coqui.ai开发的一个开源深度学习文本转语音工具包。作为一个功能强大且经过实战检验的项目,TTS为研究人员和开发者提供了先进的语音合成能力。自发布以来,TTS在GitHub上已获得超过33,000颗星,成为该领域最受欢迎的开源项目之一。TTS的目标是为语音合成任务提供高性能的深度学习模型。它不仅包含了多种先进的文本到语音模型,还提供了语音编码器和声码器

文章图片
#深度学习#人工智能
SecretFlow:隐私计算领域的开源统一框架

SecretFlow是一个开源的隐私计算统一框架,由蚂蚁集团开源并主导开发。它旨在为隐私保护数据分析和机器学习提供全面的解决方案。SecretFlow整合了多种隐私计算技术,包括联邦学习、多方安全计算、同态加密等,为用户提供了一站式的隐私计算平台。SecretFlow作为一个开源的隐私计算统一框架,为解决数据价值与隐私保护之间的矛盾提供了一个强有力的工具。它不仅仅是一个技术项目,更代表了一种新的数

文章图片
#人工智能
MediaPipe:Google开源的跨平台机器学习解决方案

MediaPipe是由Google开发的开源框架,旨在构建跨平台的机器学习管道,特别适用于处理多媒体数据如视频和图像。它提供了一套库和工具,让开发者能够快速将人工智能(AI)和机器学习(ML)技术应用到自己的应用程序中。无论是在移动设备、网页应用还是嵌入式系统上,MediaPipe都能提供高效的性能表现。: 用于部署解决方案的跨平台API和库: 预训练的、即用型模型: 允许使用自定义数据定制模型:

文章图片
#开源#机器学习#人工智能
audioFlux:全面而强大的音频分析和特征提取工具库

audioFlux是一个强大的音频分析和特征提取工具库,为音频和音乐分析、特征提取提供了全面的解决方案。它支持数十种时频分析变换方法和数百种相应的时域和频域特征组合,可以为深度学习网络提供训练数据,用于研究音频分类、分离、音乐信息检索(MIR)和自动语音识别(ASR)等音频领域的各种任务。audioFlux作为一个功能全面、性能优异的音频分析工具库,为音频处理和音乐信息检索领域的研究和应用提供了强

文章图片
#音视频#python#人工智能 +3
awesome-llm-role-playing-with-persona学习资料汇总 - 大语言模型角色扮演与人格赋予技术综述

是一个关于大语言模型角色扮演与人格赋予的资源汇总项目。该项目收集了相关的论文、数据集、评测基准等资料,涵盖了角色扮演、多智能体交互、拟人化认知等多个研究方向。awesome-llm-role-playing-with-persona项目为研究人员提供了宝贵的学习资源。本文对该项目进行了简要介绍和梳理,希望能为相关研究人员和开发者提供参考。随着技术的不断进步,大语言模型的角色扮演和人格赋予能力必将为

文章图片
#语言模型#搜索引擎#人工智能
    共 168 条
  • 1
  • 2
  • 3
  • 17
  • 请选择