每日一看大模型新闻（2023.11.25-27）亚马逊CloudWatch发布支持人工智能自然语言查询生成的功能；用视觉来做Prompt，IDEA研究院新模型；Q* 假说：世界模型探秘

此外，它还允许在对延迟敏感的应用程序中分配更多的FLOP，进一步降低延迟。无怪乎Q*项目曝出三天后，热度还在持续上升，已经引起了全网AI大佬的探讨。它采用了LFA和局部卷积增强注意力机制的创新，能够有效地捕捉局部信息和短依赖信息，从而使模型能够更准确地理解上下文之间的强语义关联，并在编程能力方面学习人类语言习惯的本质。未来，借助浪潮信息在AI算力平台和OGAI智算软件栈等方面的长期技术积累，源2.

liuxiuxiu3

1093人浏览 · 2024-01-16 17:51:15

liuxiuxiu3 · 2024-01-16 17:51:15 发布

1.产品发布

1.1谷歌推出AI Core应用，管控手机本地AI模型

发布日期：2023.11.27

Google rolling out first AI Core update on Pixel 8 Pro

主要内容：谷歌最近在Play商店推出了名为AI Core的应用程序。据描述，AI Core为安卓设备上的AI功能提供支持，并为应用程序提供最新的AI模型。这些AI驱动的功能使用最新的基础模型直接在设备上运行。为了保持这些功能的智能，设备会自动更新AI模型。AI Core管理这些更新，同时向其他应用程序提供AI功能。

1.2 CardanoGPT推出AI聊天机器人Girolamo，标志着区块链与AI融合新阶段

发布日期：2023.11.27

CardanoGPT 宣布 Girolamo AI 聊天机器人 Beta 版发布，将 AI 融入区块链技术 | 前途科技

主要内容：CardanoGPT专注于将人工智能引入Cardano生态系统的区块链。该团队最近推出了CardanoGPT，一款AI聊天机器人。撰写时，Cardano价格为0.3919美元。CardanoGPT宣布了Girolamo的Beta版启动，标志着在区块链上探索人工智能应用的新阶段。该AI聊天机器人的目标是使区块链应用更具互动性和多功能性。

1.3浪潮信息发布千亿级开源大模型源2.0

发布日期：2023.11.27

浪潮信息发布源2.0基础大模型，千亿参数全面开源

主要内容：浪潮信息正式发布了参数值分别为1026亿、518亿、21亿的千亿级开源大模型源2.0。据介绍，源2.0在数理逻辑、数学计算和代码生成能力上有了进一步的发展。它采用了LFA和局部卷积增强注意力机制的创新，能够有效地捕捉局部信息和短依赖信息，从而使模型能够更准确地理解上下文之间的强语义关联，并在编程能力方面学习人类语言习惯的本质。

未来，借助浪潮信息在AI算力平台和OGAI智算软件栈等方面的长期技术积累，源2.0将持续为大模型创业者和开发者提供更丰富、更全面的支持，并提供更开放的技术创新空间。

开源地址：https://github.com/IEIT-Yuan/Yuan-2.0

论文链接：

https://github.com/IEIT-Yuan/Yuan-2.0/blob/main/docs/Yuan2.0_paper.pdf

1.4全国首个家庭服务产业大模型发布

发布日期：2023.11.26

全国首个家庭服务产业大模型发布 - 财经 - 中工网

主要内容：全国首款家庭服务产业大模型——丽阳神州家庭服务产业大模型发布。该模型由丽阳神州智能科技有限公司与家庭服务领域的龙头企业阳光大姐联合打造，基于后者20余年的行业知识和数十万服务员的实践数据进行训练。该模型具备家政服务智能撮合、知识增强和人机协同等功能。丽阳神州成立于2018年，创始合伙人李硕曾任百度副总裁，长期专注于产业数字化和智能化领域。井焜曾任IBM大中华区高级经理、天津市蓟县人民政府挂职县长助理，神思电子技术股份有限公司董事、总经理，并主持了30多个省部级AI重大支持课题。

1.5亚马逊CloudWatch发布支持人工智能自然语言查询生成的功能（预览版）

发布日期：2023.11.26

Use natural language to query Amazon CloudWatch logs and metrics (preview) | AWS News Blog

主要内容：亚马逊CloudWatch宣布推出Logs Insights和Metrics Insights的生成式人工智能支持自然语言查询生成的功能，目前处于预览版。该功能利用生成式人工智能，使用户能够通过简单的语言快速生成与日志和度量数据相关的查询。通过简化查询生成过程，无需深入了解查询语言即可加速对观测数据的洞察。该功能为CloudWatch Logs和Metrics Insights提供了三个主要功能。首先，它从自然语言问题中生成查询，帮助您轻松入门。例如，您可以提出问题，比如“显示最慢的10个Lambda请求？”或“哪个DynamoDB表被最频繁地限制了？”其次，它提供逐行查询解释，帮助您学习查询语法。第三，它通过自然语言指导查询迭代的方式，帮助您完善现有查询。该功能目前在美国东部（北弗吉尼亚）和美国西部（俄勒冈）地区提供支持。

1.6用视觉来做Prompt，IDEA研究院新模型

发布日期：2023.11.25

用视觉来做Prompt！沈向洋展示IDEA研究院新模型，无需训练或微调，开箱即用 | 量子位

主要内容：近日，IDEA研究院创院理事长、美国国家工程院外籍院士沈向洋在IDEA年度大会上展示了最新的研究成果——基于视觉提示模型T-Rex。该模型可以利用视觉示例指定检测目标，克服了一些物体难以用文字充分表达的问题，以提高提示效率。除此之外，该模型还支持多轮正例模式、正例+负例模式和跨图模式等三种进阶模式，并可以通过与用户交互的方式进行纠错等。T-Rex主要由图像编码器、提示编码器以及框解码器三个组件组成。该研究成果来自IDEA研究院计算机视觉与机器人研究中心。

地址：T-Rex Counting

2.技术更新

2.1预测token速度翻番！Transformer新解码算法火了，来自小羊驼团队

发布日期：2023.11.26

预测token速度翻番！Transformer新解码算法火了，来自小羊驼团队-51CTO.COM

主要内容：小羊驼团队的新研究火了，他们开发了一种名为"Lookahead Decoding"的并行解码算法，可以大幅提高模型预测速度，加速LLM推理。该算法利用雅可比迭代法打破自回归解码的顺序依赖性，无需草稿模型或数据存储，减少解码步骤。作者已提供与huggingface/transformers兼容的实现，使用者可轻松增强HF原生生成的性能。该方法在离散设置上效果显著，让我们离"即时大模型"更近了一步。前向解码通过并行生成不相交的n-grams来加速解码，并将其集成到序列中，实现快速生成多个token。前向解码不需要草稿模型，简化了部署，并大幅减少解码步骤数。此外，它还允许在对延迟敏感的应用程序中分配更多的FLOP，进一步降低延迟。

地址：

https://github.com/hao-ai-lab/LookaheadDecoding

Break the Sequential Dependency of LLM Inference Using Lookahead Decoding | LMSYS Org

3.商业动态

3.1中国大模型语料数据联盟新增12家成员

发布日期：2023.11.27

我校加入中国大模型语料数据联盟

主要内容：2023全球数商大会在上海举办了“数据要素市场与大模型语料库论坛暨中国大模型语料数据联盟开放日活动”。在此次活动中，有12家新成员单位加入了“中国大模型语料数据联盟”。这些单位包括上海市新能源汽车公共数据采集与监测研究中心、华院计算技术（上海）股份有限公司、星环信息科技（上海）股份有限公司、上海市AI行业协会、上海稀宇科技有限公司、上海四维图新科技股份有限公司、上海世纪出版（集团）有限公司、上海第二工业大学、上海市人民检察院、瑞因凡（上海）智能科技有限公司、北京晴数智慧科技有限公司、北京清博智能科技有限公司。

3.2 Salesforce在AWS上销售AI软件等

发布日期：2023.11.27

https://www.bloomberg.com/news/articles/2023-11-27/salesforce-to-sell-software-on-aws-marketplace-in-self-service-purchase-push?srnd=technology-vp

主要内容：CRM巨头Salesforce计划开始在亚马逊云服务（AWS）上销售其大部分软件，以扩大“自助”购买并降低成本。Salesforce执行副总裁帕特里克·斯托克斯（Patrick Stokes）在接受采访时表示，Salesforce客户将能够使用AWS Marketplace上的积分进行支付。此协议还将使客户更轻松地将AWS数据集成到Salesforce产品中，并更有效地使用生成式AI工具。

3.3国内首个存算一栈式数据中心落地华南理工大学

发布日期：2023.11.27

国内首个！华南理工大学落地存算一栈式数据中心_中国网

主要内容：华南理工大学液冷数据中心是业内首个成功部署的存算一栈式液冷数据中心。该数据中心广泛承载着科研平台和智慧校园等业务，为国家科研项目和在校超10万名师生提供密集的数据计算资源。该校数据中心面临的最大难题是性能、质量、绿色环保与成本之间的平衡。在数据中心的低能耗发展趋势下，存储已成为降低能耗的关键突破口。曙光存储携高密度液冷ParaStor存储系统，基本为华南理工大学实现了全栈式液冷数据中心建设，直接扩展近25PB存储空间，最高可使数据中心能耗降低30%。此次华南理工大学存算一栈式液冷数据中心的成功落地和应用，不仅为科研教育的绿色数字化建设提供了样板案例，也为AI、运营商、科教等高耗能行业与应用场景带来新的解决方案，助力千行百业可持续发展。

3.4字节跳动成立新部门Flow，发力AI应用层

发布日期：2023.11.27

字节跳动成立新部门Flow，发力AI应用层_凤凰网

主要内容：字节跳动成立了新AI部门Flow，业务带头人为朱文佳，主要聚焦在AI应用层。Flow已经在国内和海外上线了豆包和Cici两款产品，并有多个AI相关创新产品孵化中。此次调整中，字节从飞书、抖音等各个BU抽调人选，到这一部门做一款新的C端产品。字节已经形成了从模型层到应用层的全面布局。在今年6月开始内部测试一款AI对话类产品“Grace”，也就是后来推出的豆包前身。

4.其他资讯

**4.1 Q* 假说：世界模型探秘**

发布日期：2023.11.27

OpenAI神秘Q*毁灭人类？爆火「Q*假说」竟牵出世界模型，全网AI大佬长文热议|AI|算法_新浪科技_新浪网

主要内容：OpenAI的神秘Q*项目，已经引爆整个AI社区！Q*疑似接近AGI，因为巨大计算资源能解决某些数学问题，让Sam Altman出局董事会的导火索，有毁灭人类风险……这些元素单拎出哪一个来，都足够炸裂。无怪乎Q*项目曝出三天后，热度还在持续上升，已经引起了全网AI大佬的探讨。AI2研究科学家Nathan激动地写出一篇长文，猜测Q假说应该是关于思想树+过程奖励模型。而且，Q*假说很可能和世界模型有关！

4.2 HF CEO分享2024年AI行业六大预测

发布日期：2023.11.27

https://twitter.com/ClementDelangue/status/1729158744762626310?s=20

主要内容：Hugging Face开源社区的CEO克莱门特·德洛夫（Clément Delangue）在社交平台上分享了他对2024年人工智能行业的六大预测。他预测说：一家备受炒作的人工智能公司可能会破产，或者以极低的价格被收购；开源大型语言模型（LLM）将达到与闭源LLM相媲美的水平；人工智能将在视频、时间序列、生物和化学领域取得重大突破；人们将更多地关注人工智能的成本，包括经济成本和环境成本；流行媒体将主要由人工智能生成；Hugging Face上数百万人工智能工程师将迎来新的工作机会，而失业率不会增加。