logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

数据采集与预处理

目录1.采用哪些方式可以获取大数据?2.常用大数据采集工具有哪些?3.简述什么是Apache Kafka数据采集。4.Topic可以有多少个分区,这些分区有什么用?5.Kafka抽象具有哪种模式的特征消费组?6.简述数据预处理的原理。7.数据清洗有哪些方法?8.数据集成需要重点考虑的问题有哪些?9.数据变换主要涉及哪些内容?10.分别简述常用ETL工具...

Byzer-LLM环境安装

Byzer-LLM 是基于 Byzer 的一个扩展,让用户可以端到端的完成业务数据获取,处理,finetune大模型,多场景部署大模型等全流程。该扩展的目标也是为了让企业更好的将业务数据注入到私有大模型(开源或者商业),并且可对外提供多场景部署形态,诸如 ETL, 流式计算,API 服务 等。

文章图片
一文快速入门Byzer-python

Byzer通过 Byzer-python 扩展(内置)来支持Python 代码。通过 Byzer-python,用户不仅仅可以进行使用 Python 进行 ETL 处理,比如可以将一个 Byzer 表转化成一个分布式DataFrame on Dask 来操作,支持各种机器学习框架,比如 Tensorflow,Sklearn,PyTorch

文章图片
#开发语言
利用 onnxruntime 库同时推理多个模型的效率研究

利用 onnxruntime 库同时推理多个模型的效率研究

文章图片
#算法#人工智能#python
如何使用Ultralytics训练自己的yolo5 yolo8 yolo10 yolo11等目标检测模型

用yolo8在自己的数据集上训练模型首先需要配置好YOLO8的环境,如果不会配置YOLO8环境可以参考。

文章图片
Gradio部署应用到服务器不能正常访问

之后,我又修改了share=True,Gradio返回了一个类似这样的地址,通过这个地址还是访问不到应用,后来查阅资料才发现share=True返回的地址是 Gradio 官网提供的免费公共 URL,可以通过公网访问你本地部署的 Gradio 应用程序。但是我部署到的团队服务器跟我的电脑是局域网连接起来的,这个服务器外网是访问不到的。用Gradio部署一个基于ChatGLM-6B的应用,发布到团队

文章图片
#服务器#运维
Python标准库glob模块详解

glob模块是按照 Unix shell 所使用的规则找出所有匹配特定模式的路径名称。我们只需要了解该模块的匹配规则与常用函数,就会使文件查找,路径匹配变得非常快捷简单。

#python
基于Byzer-LLM和ChatGLM-6B快速搭建一款免费的语言大模型助力电商企业

基于Byzer-LLM和ChatGLM-6B快速搭建一款免费的语言大模型助力电商企业

文章图片
一文读懂什么是Byzer

Byzer是一门全新的语言,不过它是一门面向大数据、AI、云原生的分布式语言,它内置了许多插件,可以帮助软件行业工程人员更好地在数据分析、机器学习、AI等领域落地实际的应用项目。这门语言诞生的初衷是从编程语言层面上进行革新,从根本上提高数据平台落地和 AI 工程化的效率,在统一的平台上实现过去要使用多语言、多平台、多组件才能实现的事情。

文章图片
    共 13 条
  • 1
  • 2
  • 请选择