Black_Rock_br 个人主页

@Black_Rock_br

Black_Rock_br

2024-09-05 00:05:16 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

AI瘦身狂魔！微软推出原生1-bit大模型，性能不减，内存仅需同行零头！

首先，在内存占用方面，该模型的非嵌入层内存占用仅为0.4GB，这一数字远低于其他全精度模型。最后，在解码延迟方面，该模型在CPU上的平均延迟仅为29毫秒，这一速度远低于其他模型，确保了在实际应用中的高效性和实时性。BitNet b1.58 2B4T 模型具备约20亿参数，在4万亿token的海量语料上完成训练，展现出与同级别全精度大模型（如 LLaMA 3.2 1B、Qwen2.5 1.5B、Ge

#人工智能

[特殊字符] TTS格局重塑！B站推出Index-TTS，速度、音质、情感表达全维度领先

中文中大量存在多音字（如“长”可读作“zhǎng”或“cháng”），其正确发音高度依赖上下文，传统TTS系统常因语义理解不足而误读，影响语音自然度与可懂度。（卷积增强型 Transformer）作为骨干网络，融合卷积层的局部感知能力与自注意力机制的长程依赖建模优势，能够高效捕捉语音信号在时间与频域上的复杂特征，为高质量语音合成奠定基础。若已标注，则优先采用用户指定发音，兼顾自动化与精准控制。：将

#人工智能 #音视频 #python

检索过时了？微软KBLaM实现知识库“脑内集成”，推理更稳更快｜ICLR 2025高光论文

传统 RAG 像给大模型外挂一座图书馆：先查目录，再搬书，最后让模型读书答题——流程长、延迟高、易翻车。微软在 ICLR 2025 亮相的干脆拆掉这座图书馆，把整座知识库压缩成连续键值向量，直接“缝”进模型注意力层，实现零检索、零延迟、零微调的知识推理。检索已成过去式，知识现在住在大脑的突触里。

#microsoft

别只盯着 Ollama，Janus-Pro 本地高级部署教程来袭

以多模态理解为例，我们需要修改相关代码中的几个部分，大家可以根据我下面放出来的代码片段，将model_path、image、question 变量的内容进行修改，替换为自己模型的路径、图片所在的路径以及想要提问的内容。点击这个网址，就能看到 DeepSeek 的页面，红框里的模型就是我们熟悉的 R1 以及 Janus-Pro 模型，两者的下载过程是一样的，这里雨飞就以 Janus-Pro 为例，给

#人工智能

iPhone 智能进化：Siri 调用 DeepSeek 大模型

借助 Siri 的快捷指令功能，连接至 DeepSeek 的开放 API 接口。只需通过语音唤醒 Siri 并说出关键字 “DeepSeek”，即可直接调用 DeepSeek 官方的大模型。如果没有，可以在 App Store 中搜索并下载“快捷指令”应用。在“运行 Siri 指令”操作的配置界面中，输入你想要通过 Siri 说出的关键字，例如“DeepSeek”。在搜索框中输入“Siri”，找到

#iphone #ios #语言模型

从零开始搞懂大模型：Token、上下文长度和最大输出的故事

举个例子，当你打开 DeepSeek 的会话窗口，开启一个新的对话，然后输入内容，接着模型生成输出内容——这就是一次完整的 **单次推理过程**。在这个简单的一来一回中，所有内容（输入 + 输出）的总 token 数不能超过 64K（约 6 万多字）。在多轮对话中，每次交互的内容都会被累积到 **上下文** 中，作为后续对话的背景信息。这意味着，随着对话的进行，历史内容会占用更多的 token 空

#java #开发语言

llama.cpp框架下GGUF格式及量化参数全解析

在人工智能领域，语言模型的高效部署和推理一直是研究热点。随着模型规模的不断扩大，如何在有限的硬件资源上实现快速、高效的推理，成为了一个关键问题。`llama.cpp`框架以其出色的性能和灵活性，为这一问题提供了有效的解决方案。其中，GGUF格式和模型量化参数是实现高效推理的重要技术手段。本文将对`llama.cpp`框架下的GGUF格式及量化参数进行详细解析，帮助读者更好地理解和应用这些技术，提升

#人工智能

检索过时了？微软KBLaM实现知识库“脑内集成”，推理更稳更快｜ICLR 2025高光论文

#microsoft

大家盯着软件 MCP，被忽视的“沉默主角”其实是硬件

它们不再是被动听令的螺丝刀，而是开始长出“心眼”的小代理——你随口一句“我累了”，它就把灯调到傍晚色温、窗帘拉到半掩、空调切到微风睡眠曲线，再顺手把音箱放进白噪音歌单。于是“智能”秒变“智障”。它做的，是把每一个硬件的“功能”封装成 AI 能理解、能调度的“标准动作”。它能听懂你的指令，理解上下文，还能根据实际情况“即兴发挥”，动态生成最优动作方案。不再是“你说一个指令，设备执行一个动作”的简单触

#人工智能

MCP 与 Function Calling 打开真实世界的两种“母体”方式

本文将以通俗易懂的方式，带你深入了解这两项核心技术的工作原理、各自特点以及在实际场景中的应用价值，助你全面掌握现代AI系统“动手办事”的背后逻辑。两者的融合，正在催生一个更智能、更灵活、更无缝融入人类生活的AI新时代。本文将以通俗易懂的方式，深入解析MCP（模型调用协议）与函数调用的核心概念，比较二者的异同，并探讨它们在实际应用中的典型场景。试想一下，如果你的AI助手只能基于训练时学到的信息回答问

#人工智能

共 95 条

请选择