api
api.java该包用于java编程时 JavaDoubleRDD将scala Double 转java Double 注意一行代码:import java.lang.{Double => JDouble}scala语法起了个类的别名 而java也有类似
api.java该包用于java编程时 JavaDoubleRDD将scala Double 转java Double 注意一行代码:import java.lang.{Double => JDouble}scala语法起了个类的别名 而java也有类似
小数据量对比 alluxio - 适合异地多机房,网络带宽足够大,机器学习这种数据短期重复使用的 ignite - 小数据量,本地计算 IQ presto carbondata FromcarbonToSpark尽量上位原理 不讲细节。 不提carbon,但是讲其中的相关内容?+
bloom filter-属于datamap 空间换时间 先介绍minmax, 当数据比较离散时,导致minmax效果不大 当数据比较集中时, 某列不是sort column时 参数配置是个比较困难的问题对比 32k 超长字符串 carbon设计问题,原本用short存
与虚拟机完全通过xshell/moba等工具交互 Linux mint jdk8 hdfs3.3.4 spark3.1.3 thrift 0.20 不需要任何header 环境变量可选写入/etc/profile或者~/.profil
业务挤压时间,忙于应付各种突如其来的需要,无暇优化、做细
install123export version="2.3.3"wget "https://archive.apache.org/dist/incubator/seatunnel/${version}/apache-seatunn
InitEnv安装12wsl --list --onlinewsl --install Ubuntu-22.04 通过迁移 更改WSL存储目录12345678wsl -l --all -vwsl --shutdownwsl --export Ubuntu E:\runtime\
Ozone/HDDShttps://ozone.apache.org/docs/1.2.1/index.html 分布式存储 兼容S3对象存储API兼容HDFS使用RAFT协议 概念:Ozone consists of volumes, buckets, and key
语言:Python特色:Workflows as code 上述两点结合,可以有动态流程 UI比较复杂
参数$[yyyyMMdd-1] 日期不允许参数将年月日拆分并t-1时只对天-1,必须对年月日都进行-1操作 会出现跨月时出错。20230401执行20230431