logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【2024年终总结】2024年最值得读的 AI 论文

对于刚刚过去的 2024 年,有哪些论文值得反复阅读?知名机器学习与 AI 研究者 Sebastian Raschka 整理了一份关于LLM 的阅读清单(),清单详细介绍了每个月都有哪些重要论文产出。

文章图片
#人工智能
最新开源:全球首个半导体专用大模型SemiKong 70B发布!全球首个中文安全领域事实性基准评测集!

涵盖了包括中国违法违规,伦理道德,偏见歧视,辱骂仇恨,身心健康,谣言错误,网络安全理论知识等方面的安全知识。SemiKong 旨在通过将领域特定的知识融入模型中,解决半导体行业面临的独特挑战,如半导体器件和工艺的物理和化学问题,充当该领域的“数字专家”,从而显著加快新芯片的上市速度。SemiKong 系列模型是双语语言模型,训练于 3T 多语言语料库,展示了在语言理解、常识推理、阅读理解等方面的强

文章图片
机器人前瞻:1X发布全新人形机器人!还有史上最惊悚的机器人!

是 Figure 首个人形视觉-语言-动作(VLA)模型,它统一了感知、语言理解和学习控制,可以克服机器人技术中的多个长期挑战。Clone Robotics 是一家成立于 2021 年的波兰创业公司 —— 专注于仿生机器人技术,致力于实现类似生命体的运动、力量和灵巧度。公司成立后推出的首个产品名叫「Clone Hand」,这是一款配备人工肌肉和骨骼的机械臂,其行为模式与人手相似。是首个同时操控两台

文章图片
#机器人#AIGC
AI大神 Sebastian Raschka 发布新书《从零开始构建大语言模型》

书的地址:https://livebook.manning.com/book/build-a-large-language-model-from-scratch/这本书用清晰的文字、图表和示例解释每个阶段,从最初的设计和创建,到采用通用语料库进行预训练,一直到针对特定任务进行微调。配套的代码:https://github.com/rasbt/LLMs-from-scratch。,我将分享更多自己的

文章图片
#人工智能#语言模型#自然语言处理
CVPR 2025 录用结果公布!严禁AI评审!大模型参评审稿人的19篇论文被桌拒

CVPR 领域主席(Area Chair/AC)曝出:一些极不负责审稿人,要么彻底放弃了评审过程,要么提交了质量极低的审稿结果,其中一些结果还是由大型语言模型(LLM)生成的。最终,CVPR 官方公布了对此事件的处理结果:项目主席 (PC)决定拒收这些审稿人撰写的 19 篇论文,实施「根据 CVPR 2025 此前公布的政策,确认了这些高度不负责的评审员,并追溯到他们作为作者提交的论文。此外,更惊

文章图片
AI大神 Sebastian Raschka 发布新书《从零开始构建大语言模型》

书的地址:https://livebook.manning.com/book/build-a-large-language-model-from-scratch/这本书用清晰的文字、图表和示例解释每个阶段,从最初的设计和创建,到采用通用语料库进行预训练,一直到针对特定任务进行微调。配套的代码:https://github.com/rasbt/LLMs-from-scratch。,我将分享更多自己的

文章图片
#人工智能#语言模型#自然语言处理
Jupyter Notebook插入图片、文件导出pdf,html

Jupyter Notebook插入图片Markdown下插入本地或者网络图片插入格式是:![图片标签](图片源src)#插入本地图片![pic_dog](./img/1.jpg)插入网络图片:图片源设置为图像地址,具体可查看网页代码,如下找到图像地址为src=assets/main-logo.svg#插入网络图片![jupyter](http://jupyter.org/a...

盘点2023年Q3的开源模型,这些值得推荐!

文章目录盘点2023年Q3「值得推荐」的开源模型!基座模型LLaMA 2Baichuan 2ChatGLM2-6BQwen-14BInternLM-20BTigerbot-13BTigerbot-70B多模态模型LLaVA 1.5VisualGLM-6BVisCPMNexT-GPTMiniGPT-5Qwen-VLAgent开发AgentsAgentVerseAutoAgentsMetaGPTAut

文章图片
#人工智能
细数AI程序员 Devin、SWE-agent、通义灵码、Devika...,“码农”要失业了吗?

3月12日,美国AI初创公司Cognition AI在X平台发布一条视频,宣布了首位完全自主的AI程序员 Devin 的诞生。第一位接近人类的 AI 程序员,究竟强在哪里?不同于我们在前两年看到的 GitHub Copilot 等 AI 编程助手,Devin 并非单纯辅助的角色,而是能够完全独立、端到端地完成整个开发项目,包括从编写代码、修复 Bug 到最终执行的完整编程生命周期。Devin 不仅

文章图片
#人工智能
Mistral AI 再发力!最强开源多模态模型 Pixtral Large!对标ChatGPT全面升级le Chat!

Mistral AI 在 9 月份甩出了自家的首款多模态大模型 Pixtral 12B,如今,Pixtral 12B 技术报告全公开。从论文的测试结果来看,Pixtral 12B 明显优于其他类似大小的开源模型(比如 Llama-3.2 11B 和 Qwen-2-VL 7B),甚至在一些评测中,表现比 Meta 家的多模态老大哥 Llama-3.2 90B 还要好。

文章图片
#人工智能
    共 99 条
  • 1
  • 2
  • 3
  • 10
  • 请选择