Manhua

Manhua

Never Say Die

    • 主页 | Home
    • 归档 | Archives
    • 简介 | About

hdfs

写盘策略节点-磁盘 偏好位置 IO隔离

2024-01-23

copy-on-write

写时复制(Copy-on-write,简称COW) 性能优化策略 if you modify the second variable, Swift takes a full copy at that point so that only the second variable

2024-01-23

spark

多counter性能问题 - whole stage codegen,生成的代码长度超过JIT 开窗counter - spark context 外包一层 任务调度本地性 任务数量

2024-01-23

protobuf-storetypes

信息传递数据结构

2024-01-23

api

api.java该包用于java编程时 JavaDoubleRDD将scala Double 转java Double 注意一行代码:import java.lang.{Double => JDouble}scala语法起了个类的别名 而java也有类似

2024-01-23

other_tools

小数据量对比 alluxio - 适合异地多机房,网络带宽足够大,机器学习这种数据短期重复使用的 ignite - 小数据量,本地计算 IQ presto carbondata FromcarbonToSpark尽量上位原理 不讲细节。 不提carbon,但是讲其中的相关内容?+

2024-01-23

Features

bloom filter-属于datamap 空间换时间 先介绍minmax, 当数据比较离散时,导致minmax效果不大 当数据比较集中时, 某列不是sort column时 参数配置是个比较困难的问题对比 32k 超长字符串 carbon设计问题,原本用short存

2024-01-23

env_hyperv

与虚拟机完全通过xshell/moba等工具交互 Linux mint jdk8 hdfs3.3.4 spark3.1.3 thrift 0.20 不需要任何header 环境变量可选写入/etc/profile或者~/.profil

2024-01-23

work

业务挤压时间,忙于应付各种突如其来的需要,无暇优化、做细

2024-01-23

seatunnel

install123export version="2.3.3"wget "https://archive.apache.org/dist/incubator/seatunnel/${version}/apache-seatunn

2024-01-23
<span></span>Prev123456…11Next<span></span>

Github Card

Categories

  • 2.10.24
  • AI1
  • Application2
  • BigData7
  • CheatSheet42
  • Computing2
  • Database2
  • Development1
  • Info1
  • Infrastructure1
  • System1
  • ai1
  • cluster1
  • database3
  • os2
  • spark2
  • storage1
  • virtualization1
  • visualization1
  • 慢话1

Tags

  • BigData4
  • carbondata4
  • project2
  • Hadoop2
  • Database2
  • rdma1
  • software1
  • recommendation1
  • RAG1
  • LLM1
  • Langchain1
  • Ollama1
  • Cluster1
  • HDFS1
  • Infrastructure1
  • Git1
  • Version Control1
  • Development1
  • Flink1
  • Stream Processing1

Links

  • cnBlogs

Hello ,I'm Manhua Jiang.
This is my blog,believe it or not.

Powered by hexo and Theme by Jacman © 2025 Manhua