logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

开源的混合AI搜索引擎;定制 Claude 3 Haiku 模型; 和gpt-4o同样Transformer架构的开源视觉语言模型;离线自动转录工具

通过在Amazon Bedrock平台上进行微调,企业可以根据自己的业务需求对Claude 3 Haiku模型进行个性化定制,从而在特定领域内表现得更出色。视频转音频(Video-to-Audio)是通过输入视频片段生成具有相应语义和时间对齐的音频内容。提升在特定任务上的表现:通过编码公司和行业知识,微调使Claude 3 Haiku在分类、与定制API交互或处理行业特定数据方面表现更好。地址:h

文章图片
#人工智能#搜索引擎#transformer
发布GPT-5的方式可能会与以往不同;开源vocode使用 AI 自动拨打电话;开源gpt智能对话客服工具;AI自动写提示词

用AI通过声音与用户进行实时交流Vocode是一个旨在帮助开发者快速构建基于声音的大型语言模型(LLM)应用程序的开源库。简单来说,如果你想要开发一个能够通过声音与用户进行实时交流的应用,比如电话机器人、语音助手,或者是可以通过语音操作的游戏(比如语音指令下棋),Vocode提供了一套工具和集成服务,使这个过程变得更加简单和快捷。地址:https://github.com/vocodedev/vo

文章图片
#人工智能
AI新工具(20240122)Whisper Speech-开源文本转语音系统;Stable LM 2 1.6B-1.6亿参数稳定语言模型;OpenRouter-开源路由器,连接各种AI模型

此外,Stable LM 2 - 1.6B在评分上超过了70亿参数的MosaicML的MPT-7B,在MT-Bench得分上也超过了Qwen-1.8B和Phi-2模型。目前,WhisperSpeech的模型是在英文LibreLight数据集上训练的,但在未来的发布中,他们希望能够面向多种语言。所有代码都是开源的,因此该模型在商业应用中始终是安全可用的。OpenRouter 是一个可以替代官方API

文章图片
#人工智能#语言模型
AI新工具(20240226) YOLOv9 - 新型实时对象检测模型;Genie - Google发布的从互联网视频中学习的基础世界模型

YOLOv9是基于深度学习的一种快速、准确的对象检测算法。其主要亮点在于能够在保持较高检测精度的同时,实现快速的检测速度,适合在实时应用中使用。

文章图片
#人工智能#学习
python第三方库:使用html2text把html转换为markdown格式

在之前找了很多的库把html转换为markdown的格式,有些库效果并不是非常的好,后面使用了html2text,效果有点提升。html2text的原理是使用HTMLParser 对html的标签逐一的进行解析,并根据各个标签还原为markdown的格式。html2text 安装html2text的地址在:http://www.aaronsw.com/2002/html2text/它是一个网页格式

AI新工具(20240313) 世界上第一个完全自主的AI软件工程师Devin 已经开始接外包了;又一个开源本地知识库问答系统

Devin是世界上第一个完全自主的AI软件工程师,具备长期推理和规划的能力,能够执行复杂的工程任务,包括学习、修复错误、与用户实时合作等。Devin可以学习并使用陌生技术,构建和部署应用程序,自主查找和修复代码中的错误,训练并优化自己的AI模型,解决开源代码库中的问题和功能请求等。这个工具结合了自动可解释性技术和稀疏自动编码器,使得研究人员在编写代码之前就可以迅速地探索模型内部的工作原理,并且可以

文章图片
#人工智能
Character.AI成为新晋AI聊天应用爆款;谷歌推出 Google Slides AI 图像生成

Character.AI是一款受欢迎的人工智能聊天应用,用户可以自由创建AI角色,并与它们聊天。该应用于2023年5月23日上线后迅速爆火,安卓版本的安装量在48小时内就超过了70万次,一周后下载人数更超过了170万,甚至超过了ChatGPT。Character.AI的创始人是来自前谷歌LaMDA团队的独角兽,该公司估值已达10亿美元。用户可以和超过1000万个自定义AI角色聊天,访问量超过2亿次

文章图片
#人工智能#计算机视觉#深度学习
发型不满意试试开源AI换发型HairFastGAN;前OpenAI员工Karpathy1000纯C语言写完GPT-2

它通过一种统一的反馈学习方法,来提升图片生成的效果,加速生成过程,并增强生成物的美学吸引力。这意味着如果你有一张人物的图片和另一张你喜欢的发型的图片,HairFastGAN 能够将你喜欢的那个发型复制到人物的头上,而且看起来非常自然和真实。这一切都能在几乎实时的情况下完成,而且对于色彩和形态的传递都处理得很好。Morphic是一个使用人工智能(AI)技术的应用,它结合了多种技术栈(包括Next.j

文章图片
#人工智能
国内首款AI音乐生成大模型「天工SkyMusic」并开启免费邀测;SWE-agent 修复GitHub仓库中的BUG和问题的软件工程代理

天工SkyMusic是由昆仑万维集团开发的一款AI音乐生成工具,它基于先进的「天工3.0」超级大模型构建,代表了目前国内唯一公开可用的AI音乐生成大模型。地址:https://techcommunity.microsoft.com/t5/ai-azure-ai-services-blog/9-more-realistic-ai-voices-for-conversations-now-genera

文章图片
#人工智能#github#bug
Github每日精选(第62期):(Go 数据结构)- 集合、列表、堆栈、地图、树、队列等等GoDS

集合是一种可以存储元素并且没有重复值的数据结构。它是有限集的数学概念的计算机实现。与大多数其他集合类型不同,不是从集合中检索特定元素,而是通常测试元素在集合中的成员资格。保留插入顺序的集合。由哈希表支持的集合(实际上是 Go 的映射)。(Go 数据结构)- 集合、列表、堆栈、地图、树、队列,的使用分析。一个列表,其中每个元素都指向列表中的下一个和前一个元素。由红黑树支持的集合,以保持元素相对于比较

文章图片
#数据结构#golang#开发语言
    共 80 条
  • 1
  • 2
  • 3
  • 8
  • 请选择