DatabricksのDeclarative Pipelineでは、データ品質を担保するためのルール(Expectations)を宣言的に定義できます。ただ、実装方法として「SQL(YAMLに近い形式)」と「Python(DLTなどを活用)」の2つの選択肢があり、どちらを選ぶべきか迷う方も多いのではない ...
1. 高メモリタスク設計の背景と2層構成の考え方 Databricksの実務運用では、ジョブが突然「RESOURCE_EXHAUSTED」エラーを出して失敗するケースが多く見られます。 その本質は単なるメモリ不足ではなく、「負荷の奪い合い」によるリソース競合です。特にjoinや ...