gridstudio简介

  • 介绍

    • GridStudio是一种基于云的数据科学工具,它将电子表格视图与Python脚本环境相结合。它允许您直接在浏览器中浏览,操作和分析数据。基本思想是结合Python脚本和电子表格功能的强大功能,在Grid中可以定义自己的电子表格函数,例如 MYCUSTOMFUNC(A1);

    • 此外,在Python中,您可以轻松读取和写入工作区中的单元格。仅用df = sheet(“A1:D10”) 就可以将当前表格转换为pandas中的DataFrame,您也可以轻松地回写DataFrame如sheet(“A”, df)。

    • 通过利用Python生态系统的强大功能,可以即时访问最先进的数据科学工具:matplotlib,numpy,pandas,scikitlearn,scipy 等。这样可以轻松访问功能强大的模型,例如线性回归和用于建模数据的SVM。

    • 该应用程序在Docker容器中运行,使您可以轻松访问完全打包和隔离的UNIX环境(甚至在Windows),随时可以使用:Pythonscikit-learnnumpapandasterminalwgetzip等等。

    • 结合使用Python和电子表格需要一些人习惯,但是一旦掌握了它,就可以做一些强大的事情,比如直接查询SQL数据库并在交互式电子表格中使用结果:
      sheet(“A”, pd.read_sql(‘SELECT * FROM orders’, connection))

  • 功能
    Grid支持您可以在其他电子表格应用程序(如Microsoft Excel或Google表格)中找到的一些功能。
    现在包含以下功能:

    • SUM(value, …) - 求和
      Ex: SUM(A1:A10) 或 SUM(A1,A2)

    • AVERAGE(value, …) - 平均值
      Ex: AVERAGE(A1:A10) 或 AVERAGE(A1,A2)

    • IF(logical-value, value, value) - if 判断语句
      Ex: IF(A1 > 2, 1, 0) 或 IF(A1 == “random”, RAND(), 1)

    • MATHC(string) - 得到一个数学常数
      Ex: MATHC(“pi”) 或 MATHC(“e”) 或 MATHC(“π”) - 现在MATHC中只有 π和e

    • SQRT(number) - 求平方根
      Ex: SQRT(A1) 或 SQRT(2)

    • CONCATENATE(string-value) 或 CONCAT(string-value) - 连接字符串
      Ex: CONCAT("Hello, ", “World!”)

    • NUMBER(value) - 类型转换为数值型
      Ex: NUMBER(“0123”) = 123

    • LEN(value) - 获取对象字符串形式的长度
      Ex: LEN(“abcd”) = 4 或 LEN(100) = 3

    • COUNT(values) - 获取包含值的单元格数量
      Ex: COUNT(A1:A10) = 4 (if 4 cells are non-empty)

    • RAND() - 获取0~1之间的随机数
      Ex: RAND() = 0.92892480103

    • FLOOR(number) - 向下取整
      Ex: FLOOR(1.9) = 1

    • CEIL(number) - 向上取整
      Ex: CEIL(1.1) = 2

    • ABS(number) - 取绝对值
      Ex: ABS(-12.1) = 12.1

    • VLOOKUP(value, lookup_range, column_index) - 根据key值查询对应的value
      Ex: VLOOKUP(A1, Sheet2!$A 1 : 1: 1:D$100, 4) - look up the value in A1 in column Sheet2!A1 and return the result in the 4th column (D).

    • OLS(y_range, x1_range, x2_range, …) - 执行线性回归,格式为 y ~ x1 + x2 + …
      Ex: OLS(A1:A10, B1:B10, C1:C10) ,如A1:A10包含房价,B1:B10包含面积,C1:C10包含城市的其他因素

  • 参考链接:

https://hackernoon.com/introducing-grid-studio-a-spreadsheet-app-with-python-to-make-data-science-easier-tdup38f7
https://github.com/ricklamers/gridstudio/wiki/

gridstudio安装

windows环境下的安装

安装docker

  • Windows10专业版、教育版、企业版安装Docker Desktop(需要开启hpyer-v服务:控制面板->程序->启用或关闭Windows功能->hpyer-v打勾)
  • Windows7、Windows8及Window10家庭版安装Docker ToolBox(不推荐使用toolbox,其在设置共享目录时存在一些未知问题)

下载工程:(需要安装git)

Git clone https://github.com/ricklamers/gridstudio.git

配置镜像加速:

Docker DeskTop:

  • 在桌面右下角状态栏中右键 docker 图标,点击Setting在 Daemon 标签页中的Basic, 修改弹出的json ,把地址:
    ”http://f1361db2.m.daocloud.io”加到" registry-mirrors"的数组里,点击 Apply

Docker Toolbox:

  • 在Docker QuickStart中运行
1. docker-machine ssh default
2. sudo sed -i "s|EXTRA_ARGS='|EXTRA_ARGS='--registry-mirror=http://f1361db2.m.daocloud.io|g" /var/lib/boot2docker/profile
3. exit
4. docker-machine restart default

设置共享文件夹:

Docker DeskTop:

  • 在桌面右下角状态栏中右键 docker 图标,点击Setting在Shared Drives中选中gridstudio工程所在盘,根据提示输入windows管理员密码。

Docker Toolbox:

  • 存在未知问题,略,可自行解决。

运行bash脚本:

打开git bash,进入gridstudio目录,运行命令:sh run.sh 或 ./run.sh

使用:

访问http://127.0.0.1:8080
默认账号密码:admin admin

Linux环境下的安装

安装docker并启动:

sudo yum -y install docker
Service docker start

安装git:

sudo yum install git

下载工程:

Git clone https://github.com/ricklamers/gridstudio.git

配置镜像加速:

1.sudo mkdir -p /etc/docker
2.sudo tee /etc/docker/daemon.json <<-'EOF'
{
  "registry-mirrors": ["https://9keuivyl.mirror.aliyuncs.com"]
}
EOF
3.sudo systemctl daemon-reload
4.sudo systemctl restart docker

运行bash脚本:

进入gridstudio目录,运行命令:

1.sudo sh run.sh 

//如果提示没有权限,执行
1.sudo chmod -R 777 ../gridstudio
2.sudo sh run.sh 

使用:

访问 http://127.0.0.1:8080
默认账号密码:admin,admin

转发请说明转发源

Logo

权威|前沿|技术|干货|国内首个API全生命周期开发者社区

更多推荐