🕵️‍♂️匿名运维栈
  • 📑 书签
  • 📁 网盘
  • 🔧 运维
    • 🐧Linux
    • Jupyter
    • openstack
    • Mysql
  • 💻 开发
    • Java
    • python
    • golang
  • ☁️ 云原生
    • Docker
    • prometheus
    • kubernetes
    • cicd
  • 📊 大数据
    • Hadoop
    • Hbase
    • Hive
    • spark
    • ELK
  • 🤖 AI
  • 📜 记录
    • 杂记
  • 📑 书签
  • 📁 网盘
  • 🔧 运维
    • 🐧Linux
    • Jupyter
    • openstack
    • Mysql
  • 💻 开发
    • Java
    • python
    • golang
  • ☁️ 云原生
    • Docker
    • prometheus
    • kubernetes
    • cicd
  • 📊 大数据
    • Hadoop
    • Hbase
    • Hive
    • spark
    • ELK
  • 🤖 AI
  • 📜 记录
    • 杂记
  1. 首页
  2. 标签
  3. 数据迁移
Hive2.1 – 3.1.2 集群迁移

Hive Hive2.1 – 3.1.2 集群迁移

迁移版本 Hadoop 源版本:3.0 Hadoop 目标版本:3.0 Hive 源版本:hive-commo…

62次阅读 0个评论
Hive 2025-11-13
Hive集群迁移

大数据 Hive集群迁移

本文介绍了从Hadoop 3.0和Hive 2.1.1迁移到Hadoop 3.0和Hive 3.1.2的过程。首先通过专线或VPN打通源集群和目标集群的网络,方便数据迁移。迁移HDFS数据建议优先进行,随后再迁移Hive元数据,可在停止写入后进行全量及增量迁移。为了确保数据一致性,可使用HDFS DistCp工具进行分布式复制,并在迁移前后进行快照处理以防止数据冲突。迁移Hive元数据时需导出并修改相关表信息。通过编写Shell脚本可实现对批量表的全量或增量迁移,并记录迁移的成功与失败情况,提升作业效率和自动化程度。测试显示,数据量约7TB时,迁移速度可达450MB/s,耗时约4.5小时。

114次阅读 0个评论
大数据 2025-05-20
匿名者的博客
匿名者的博客
知道的越多,不知道的越多!
用户数
2
文章数
107
评论数
25
阅读量
8196
文章搜索
最新文章
2025:大语言模型(LLM)之年

2025:大语言模型(LLM)之年

转载自 https://simonwillison.net/2025/Dec/31/the-year-in-l...
一言一句话
-「」
陕ICP备2025068122号-1
 Theme by Puock