
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
2月2日,云轴科技 ZStack 宣布 AI Infra 平台 ZStack 智塔全面支持企业私有化部署 DeepSeek-V3/R1/ Janus Pro三种模型,并可基于海光、昇腾、英伟达、英特尔等多种国内外CPU/GPU适配,将充分发挥DeepSeek开源模型和低成本高性能特点,助力企业级AI应用进一步落地。2 月 4 日,华为计算宣布,潞晨科技携手昇腾,联合发布基于昇腾算力的 DeepSe

对于刚刚过去的 2024 年,有哪些论文值得反复阅读?知名机器学习与 AI 研究者 Sebastian Raschka 整理了一份关于LLM 的阅读清单(),清单详细介绍了每个月都有哪些重要论文产出。

涵盖了包括中国违法违规,伦理道德,偏见歧视,辱骂仇恨,身心健康,谣言错误,网络安全理论知识等方面的安全知识。SemiKong 旨在通过将领域特定的知识融入模型中,解决半导体行业面临的独特挑战,如半导体器件和工艺的物理和化学问题,充当该领域的“数字专家”,从而显著加快新芯片的上市速度。SemiKong 系列模型是双语语言模型,训练于 3T 多语言语料库,展示了在语言理解、常识推理、阅读理解等方面的强

是 Figure 首个人形视觉-语言-动作(VLA)模型,它统一了感知、语言理解和学习控制,可以克服机器人技术中的多个长期挑战。Clone Robotics 是一家成立于 2021 年的波兰创业公司 —— 专注于仿生机器人技术,致力于实现类似生命体的运动、力量和灵巧度。公司成立后推出的首个产品名叫「Clone Hand」,这是一款配备人工肌肉和骨骼的机械臂,其行为模式与人手相似。是首个同时操控两台

书的地址:https://livebook.manning.com/book/build-a-large-language-model-from-scratch/这本书用清晰的文字、图表和示例解释每个阶段,从最初的设计和创建,到采用通用语料库进行预训练,一直到针对特定任务进行微调。配套的代码:https://github.com/rasbt/LLMs-from-scratch。,我将分享更多自己的

CVPR 领域主席(Area Chair/AC)曝出:一些极不负责审稿人,要么彻底放弃了评审过程,要么提交了质量极低的审稿结果,其中一些结果还是由大型语言模型(LLM)生成的。最终,CVPR 官方公布了对此事件的处理结果:项目主席 (PC)决定拒收这些审稿人撰写的 19 篇论文,实施「根据 CVPR 2025 此前公布的政策,确认了这些高度不负责的评审员,并追溯到他们作为作者提交的论文。此外,更惊

书的地址:https://livebook.manning.com/book/build-a-large-language-model-from-scratch/这本书用清晰的文字、图表和示例解释每个阶段,从最初的设计和创建,到采用通用语料库进行预训练,一直到针对特定任务进行微调。配套的代码:https://github.com/rasbt/LLMs-from-scratch。,我将分享更多自己的

Jupyter Notebook插入图片Markdown下插入本地或者网络图片插入格式是:#插入本地图片插入网络图片:图片源设置为图像地址,具体可查看网页代码,如下找到图像地址为src=assets/main-logo.svg#插入网络图片
3月12日,美国AI初创公司Cognition AI在X平台发布一条视频,宣布了首位完全自主的AI程序员 Devin 的诞生。第一位接近人类的 AI 程序员,究竟强在哪里?不同于我们在前两年看到的 GitHub Copilot 等 AI 编程助手,Devin 并非单纯辅助的角色,而是能够完全独立、端到端地完成整个开发项目,包括从编写代码、修复 Bug 到最终执行的完整编程生命周期。Devin 不仅








