
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
是 Figure 首个人形视觉-语言-动作(VLA)模型,它统一了感知、语言理解和学习控制,可以克服机器人技术中的多个长期挑战。Clone Robotics 是一家成立于 2021 年的波兰创业公司 —— 专注于仿生机器人技术,致力于实现类似生命体的运动、力量和灵巧度。公司成立后推出的首个产品名叫「Clone Hand」,这是一款配备人工肌肉和骨骼的机械臂,其行为模式与人手相似。是首个同时操控两台

系列包括 1B、2B、4B、8B、16B 和 34B 六种不同参数规模的模型版本,以满足多样化需求。它不仅强化了小规模模型的能力密度,还通过指令微调和偏好学习大幅提升了思维链(CoT)推理能力,使其在数学推理和视频理解任务中表现尤为突出。Hopper 是英伟达的GPU(图形处理芯片)架构,例如H100和H800,发布于2022年,主要用于AI计算。引入了视频和多图像处理能力,并增强了多语言能力和复

没想到,Meta Llama 4 发布 36 小时后差评如潮:代码测试小球穿墙失效;第三方榜单成绩垫底;匿名员工爆料内部数据泄露隐患;高层离职与恐慌模式频现;合成数据争议未消;写作文本重复僵化;网友调侃“DeepSeek-R1出世两月,Meta却像熬了几辈子”...

2月19日,美国 Arc Institute 与英伟达合作,联合斯坦福大学、加州大学伯克利分校和加州大学旧金山分校的研究人员,共同推出了——。该模型以超过 128,000 个基因组的数据为基础,训练了 9.3 万亿个核苷酸,使其规模与最强大的生成性 AI 语言模型相媲美。是一种先进的 DNA 语言模型,专注于长上下文的建模和设计。它能够在单核苷酸分辨率下对 DNA 序列进行建模,支持长达 100

CVPR 领域主席(Area Chair/AC)曝出:一些极不负责审稿人,要么彻底放弃了评审过程,要么提交了质量极低的审稿结果,其中一些结果还是由大型语言模型(LLM)生成的。最终,CVPR 官方公布了对此事件的处理结果:项目主席 (PC)决定拒收这些审稿人撰写的 19 篇论文,实施「根据 CVPR 2025 此前公布的政策,确认了这些高度不负责的评审员,并追溯到他们作为作者提交的论文。此外,更惊

基于 GenAI 技术构建,而依赖于逻辑链条(Chain-of-Thought,CoT)来逐步推导出解决方案,这是一种用技术换时间和算力资源的方案,使思考模型可以用 10 分钟做完一套高考数学卷,分数超过 120 分,在逻辑推理能力上,进一步靠近人类专家。两款模型均采用 Hugging Face 的先进多模态技术,能够执行图像描述、短视频分析、文档理解等任务,尤其适合内存少于 1GB 的设备如笔记

对于刚刚过去的 2024 年,有哪些论文值得反复阅读?知名机器学习与 AI 研究者 Sebastian Raschka 整理了一份关于LLM 的阅读清单(),清单详细介绍了每个月都有哪些重要论文产出。

涵盖了包括中国违法违规,伦理道德,偏见歧视,辱骂仇恨,身心健康,谣言错误,网络安全理论知识等方面的安全知识。SemiKong 旨在通过将领域特定的知识融入模型中,解决半导体行业面临的独特挑战,如半导体器件和工艺的物理和化学问题,充当该领域的“数字专家”,从而显著加快新芯片的上市速度。SemiKong 系列模型是双语语言模型,训练于 3T 多语言语料库,展示了在语言理解、常识推理、阅读理解等方面的强

是 Figure 首个人形视觉-语言-动作(VLA)模型,它统一了感知、语言理解和学习控制,可以克服机器人技术中的多个长期挑战。Clone Robotics 是一家成立于 2021 年的波兰创业公司 —— 专注于仿生机器人技术,致力于实现类似生命体的运动、力量和灵巧度。公司成立后推出的首个产品名叫「Clone Hand」,这是一款配备人工肌肉和骨骼的机械臂,其行为模式与人手相似。是首个同时操控两台

书的地址:https://livebook.manning.com/book/build-a-large-language-model-from-scratch/这本书用清晰的文字、图表和示例解释每个阶段,从最初的设计和创建,到采用通用语料库进行预训练,一直到针对特定任务进行微调。配套的代码:https://github.com/rasbt/LLMs-from-scratch。,我将分享更多自己的








