服务粉丝

我们一直在努力

Iceberg

  • 数据湖Iceberg库表治理之 Orphan文件膨胀?

  • 日常iceberg表的生产过程中,会由于各种原因,导致很多orphan 垃圾文件,大量无效的磁盘占用,如:snap expire未完成、多端写入时由于锁竞争失败、rewrite commit失败导致等等Orphan
  • 数据湖Iceberg库表治理之 Snapshot数据冗余?

  • 实战业务场景,频繁的rewrite、mergeInto等产生大量新的replace/overwrite snapshot,会导致iceberg表的实际存储数据大量冗余,进而导致iceberg表实际磁盘存储占用急速膨胀,需要根
  • Spark + iceberg的API

  • 由于spark版本问题,所以使用 iceberg-api操作创建表。IcebergApi .javapackage org.example;

    import org.apache.hadoop.conf.Configuration;

    import org.apache.iceberg.S

栏目导览

当前栏目 · Iceberg

掌握该分类的选题方向、更新节奏以及延展阅读建议。

阅读小贴士

将想看的文章加入书签,或分享到工作群,方便协作讨论。

沉浸体验

结合站内其他频道(财经、科技、生活)形成完整信息链路。

精选阅读导航

  • 娱乐热点

    追踪影娱圈新鲜事,轻松掌握话题焦点。

    直达频道
  • 商业财经

    洞察市场动向与行业趋势,辅助决策判断。

    直达频道
  • 品质生活

    集结旅行、美食、健康灵感,为生活加分。

    直达频道