导入数据

准备数据

http://files.grouplens.org/datasets/movielens/
movieslens数据集,ratings.csv 26024314条数据

上手
链接clickhouse

docker exec -it  ch-server /bin/bash

1.准备数据

/ratings.csv

2.进入clickhouse-client建表

clickhouse-client
CREATE TABLE ratings(userId Int64,  moveId Int64,  rating Float64, tm Int64) ENGINE = Log;

3.退出clickhouse-client导入

cat /ratings.csv | clickhouse-client --query="INSERT INTO ratings FORMAT CSV";

4.进入clickhouse-client验证
查询

SELECT count(1) FROM ratings 
┌─count(1)─┐
│ 26024314 │
└──────────┘
0.166 秒
select rating,count(1) from ratings group by rating order by count(1);
┌─rating─┬─count(1)─┐
│    1.5 │   403607 │
│    0.5 │   404897 │
│      1 │   843321 │
│    2.5 │  1255358 │
│      2 │  1762440 │
│    4.5 │  2170443 │
│    3.5 │  3116214 │
│      5 │  3812505 │
│      3 │  5256722 │
│      4 │  6998807 │
└────────┴──────────┘
0.78秒

真是飞快,飞快,飞快

Logo

权威|前沿|技术|干货|国内首个API全生命周期开发者社区

更多推荐