常见的技术组件如下:
2.云平台 (AWS、、GCP、Microsoft Azure)
3.监控管理 (CM、Hue、AmbariDr.Elephant、Ganglia、ZabbixEagle、Prometheus)
4.文件系统 (Hadoop、GPFS、CephGlusterFS、Swift、BeeGFSAlluxio、JindoFS)
5.资源调度 (K8S、YARN、MesosStandlone)
6.协调框架 (ZooKeeper、Etcd、Consul)
7.数据存储 (HBase、Cassandra、ScyllaDBMongoDB、Accumulo、RedisIgnite、Geode、CouchD、Kudu)
8.行列存储 (Parquet、ORC、ArrowCarbonData、Avro)
9.数据湖 (IceBerg、Hudi、DeltaLake)
10数据处理 (MaxCompute、Hive、MapReduceSpark、Flink、StormTez、Samza、Apex、Beam、Heron)
11.OLAP (Hologres、StarRocks、GreenPlumTrino/Presto、Kylin、ImpalaDruid、ElasticSearch、HAWQ、Lucene、Solr、Phoenix))
12.数据采集 (Flume、Filebeat、Logstash、Chukwa)
13.数据交换 (Sqoop、Kettle、DataX 、NiFi )
14.消息系统 (Pulsar、Kafka、RocketMQ、ActiveMQ、RabbitMQ)
15.任务调度 (Azkaban、Oozie、Airflow、Contab、DolphinScheduler)
17.数据血缘 (OpenLineage、Egeria、Marquez、DataHub)
18.机器学习 (Pai、Mahout、MADlibSpark ML、TensorFlow、Keras、MxNet)
常见技术栈组合:
开源常见技术栈组合:
1.Iceberg+S3+Starrocks+Flink
2.HDFS+Alluxio+Spark+Trino
3.HDFS+Hive+GreenPlum
4.Minio+LakeFS+Marquez+Trino
https://www.datamesh-architecture.com/
https://www.datanami.com/2021/10/25/data-mesh-vs-data-fabric-understanding-the-differences/
https://www.starrocks.io/
https://iceberg.apache.org/
https://openlineage.io/
https://www.gartner.com/doc/reprints?id=1-2B6AXOGW&ct=220920&st=sb
https://arrow.apache.org/
https://www.starrocks.io/
https://www.getdbt.com/
https://datahubproject.io/
这网站马上线,1>N,最重要的事情只有一件,让这个网站只作程序员的助手
今天你思考了吗,停止 Ctrl+C Ctrl+V
二八原则
Find new thing
商务合作QQ:2926735852
技能树
云服务:新浪,华为,GCP,AliCloud
编程语言:Java,Python,Nodejs,Golang
容器:Docker,K8s
云原生
架构: 微服务 分布式
边缘计算
网安 Kail
大数据:Hadoop,Spark,Flink, 数据湖, 联邦学习
企业应用,Odoo
中间件:Kafka,Nsq,CDC
OS :
Linux Kernel Map分享
AI:ROS,TensorFlow
基础学科:线性代数,英语
OS :
RPA :
Linux Kernel Map分享
数字图书馆
为何Transformer在计算机视觉中如此受欢迎?
历程:
kaggle learning 2022/12/24 20:27