logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【上海38℃】酷热之下,AI能否给我降降温?

近日上海的高温冲上热搜,要我就早早躲进机房,聆听嘈杂的轰鸣,穿着皮夹克喝着热可可,看着log——以上都是我的白日梦,哈哈哈^ ^)不过,服务器和工作站确实“真芯热”,尤其是在高负载下,为此机房一般配备最爽的空调设备(个人经历)。前不久微软还结束了海底机房实验,而如今进入了大算力时代,对于超频和极端冷却又成了当下大厂和DIY极客的热门话题。难道我们不能利用AI技术来给我们降降温吗?

文章图片
#人工智能
LLaMA-Omni 2:基于 LLM 的自回归流语音合成实时口语聊天机器人

LLaMA-Omni 2 是基于 Qwen2.5-0.5B/1.5B/3B/7B/14B/32B-Instruct 模型的一系列语音语言模型。与 LLaMA-Omni 类似,它可以同时生成文本和语音应答,从而实现高质量、低延迟的语音交互。通过新引入的流式自回归语音解码器,LLaMA-Omni 2 与 LLaMA-Omni 相比实现了更高的语音质量。

文章图片
#开源#人工智能#AIGC +1
开源OCR工具olmOCR:高效实现 PDF 转文本,支持表格与手写识别

olmOCR 是一款开源的光学字符识别(OCR)工具,旨在高效地将 PDF 及其他文档转换为纯文本,同时保留自然的阅读顺序。这款工具不仅支持普通文本的提取,还能处理表格、数学公式和手写内容,极大地方便了用户对文档的处理需求。款工具的核心优势在于其高准确率。olmOCR 经过大量学术论文、技术文档及其他参考内容的训练,采用独特的提示技术来提高识别的准确性,并降低错误信息的生成。这使得用户在使用时能获

文章图片
#人工智能#AIGC#开源
NVIDIA RTX PRO 6000专业卡参数首曝:600W双风扇 超大96GB显存

NVIDIA新一代工作站显卡RTX PRO 6000的相关参数配置终于浮出水面。这款显卡采用了Blackwell架构,配备96GB的GDDR7显存,显存位宽为512bit,这也意味着其将是首款采用3GB GDDR7模块的桌面显卡。不过还是采用了双风扇散热,类似于RTX 5090的双流散热方案,此外显卡还采用了PCIe 5.0 x16接口,并配备了四个DisplayPort 2.1接口。值得注意的是

文章图片
#人工智能#AIGC
微软推出数款Phi 4“开放式”人工智能模型

微软周三推出了几款新的“开放式”人工智能模型,其中功能最强大的模型至少在一个基准测试上可与 OpenAI 的 o3-mini 相媲美。所有新的授权模型——Phi 4 mini reasoning、Phi 4 reasoning 和 Phi 4 reasoning plus——都是“推理”模型,这意味着它们能够花更多时间对复杂问题的解决方案进行事实核查。微软表示,Phi 4 mini 推理机的参数规

文章图片
#microsoft#人工智能
华为自研仓颉编程语言官网上线 首个公测版本开放下载

仓颉编程语言通过现代语言特性的集成、全方位的编译优化和运行时实现、以及开箱即用的IDE工具链支持,为开发者打造友好开发体验和卓越程序性能。安全DNA融入仓颉编程语言设计,帮助开发者专注于业务逻辑,免于将太多精力投入到防御性编程中,编码即安全,漏洞无处藏。官方表示,仓颉编程语言是一款面向全场景智能的新一代编程语言,主打原生智能化、天生全场景、高性能、强安全。仓颉编程语言项目于2019年在华为诞生,历

文章图片
#华为#harmonyos
微信鸿蒙原生版和iOS、安卓版有啥区别 腾讯员工详解

目前,微信、QQ、腾讯会议、企业微信、腾讯视频、腾讯新闻、腾讯体育、QQ浏览器、搜狗输入法、腾讯自选股、理财通、腾讯广告、QQ音乐、酷狗音乐、酷我音乐、全民K歌、懒人听书、起点读书、QQ阅读、微信读书、微信输入法等超过20款产品在不断适配迭代HarmonyOS NEXT,在确保产品稳定和用户体验前提下,腾讯将在后续版本中陆续更新完善。目前单聊、群聊中发图片、视频,音视频通话,朋友圈,以及微信支付的

文章图片
#微信#harmonyos#android
NVIDIA GeForce RTX标志升级 加入AI的力量

但是近些年,GPU成为AI加速计算的最强有力芯片,再加上CUDA的生态优势,NVIDIA在这方面可以说根本没有敌手,Intel、AMD都在提倡的CPU、GPU、NPU三位一体策略也逊色不少。如今的GeForce显卡,虽然算力不如高性能的AI GPU加速卡,但也足够强劲,即便是入门级的移动版RTX 4050,也都有120个Tensor张量核心。GeForce一直都是游戏显卡品牌,无论早期的GTX系列

文章图片
#人工智能
众人吹捧的Exo并不是真正的分布式推理,而无人问津的Cake或许才是

我就觉得这个事情或许有些不对劲,而随着最近 Meta 出了 405B,又有朋友向我推荐Exo,我不禁想知道一个 Bonjour 的 Zeroconf 怎么就让 MLX 支持 P2P 的分布式推理了。Incredible(笑)所以,我觉得它只是分布式负载均衡和MLX推理,怎么就吹成 70B 的分布式推理了。而对于 Cake,我也严谨的看了下源码,的确是self-host的分布式架构,只是纯手工配置,

文章图片
#分布式#人工智能
AI大语言模型幻觉排行榜:Gemini 2.0 Flash幻觉最低

在最新的排行榜中,谷歌的 Gemini2.0系列表现出色,尤其是 Gemini-2.0-Flash-001,以0.7% 的低幻觉率位居榜首,显示出其在处理文档时几乎没有引入虚假信息。此外,Gemini-2.0-Pro-Exp 和 OpenAI 的 o3-mini-high-reasoning 模型分别以0.8% 的幻觉率紧随其后,表现同样不俗。报告还显示,尽管许多模型的幻觉率有所上升,但大部分仍保

文章图片
#人工智能#语言模型#自然语言处理
    共 159 条
  • 1
  • 2
  • 3
  • 16
  • 请选择