技术:doris
运行环境:doris
demo功能:提供一个从hdfs中导入数据到doris中的过程
通常hive、spark等计算结果保存为orc文件,存储在hdfs中
命令demo:
LOAD LABEL vk_dw.任务名 ## 任务名,每次导入需要不一样
(
DATA INFILE ("hdfs://hdfs_host:hdfs_port/tmp/liwei5/export-data-*") ## hdfs中orc文件路径, *表示该路径下全部问文件
INTO TABLE doris表名 ##只是表名,不需要库名,所以执行命令时需要use db
COLUMNS TERMINATED BY "分隔符" ##如果分隔符,
(Col0,Col1) ##orc文件中的表头,一般情况和hive表结构相同。
SET
(
online_class_id=Col0,
book_class_scene=Col1
)
)
WITH BROKER "hdfs_broker" ## broker名字, 和doris中的broker名字必须一致
(
"username" = "hdfs用户名,无则不填",
"password" = "hdfs密码,无则不填"
)
PROPERTIES
(
"timeout" = "3600",##超时取消
"max_filter_ratio" = "0.001" ##允许1%的数据导入失败
);
EXPORT TABLE 数据库.表 TO "hdfs://hdfs_host:hdfs_port/tmp/liwei5/" ##数据保存在hdfs这个目录下
PROPERTIES
(
"column_separator"="分隔符",
"exec_mem_limit"="2147483648", ## 任务最大内存限制
"timeout" = "3600" ##任务超时时间,单位秒
)
WITH BROKER "hdfs_broker" ## broker名字
(
"username" = "hdfs用户名",
"password" = "hdfs密码"
);
欢迎添加微信,互相学习↑↑↑ -_-
白老虎
programming is not only to solve problems, ways to think
grafana 级连 菜单 templating (variables) 配置
rocketmq 集群搭建 (2master + 2slave + 2namesrv)
AI 机器人 抓取 微信 聊天中的 百度网盘 分享地址和密码