電通デジタルでバックエンド開発をしている松田です。弊社ではデータパイプラインの構築や管理のために主にApache Airflowを利用しています[1, 2]。 本記事では、AirflowのOperatorを使ってタスク実行環境を分離する方法についてご紹介します。 タスク実行環境を ...
The Apache Software Foundation(以下、ASF)は米国時間2019年1月8日、ビッグデータパイプラインを管理するためのワークフロー自動化およびスケジューリングシステム「Apache Airflow」を、トップレベルプロジェクトに押し上げたことを公式ブログで明らかにした。
外部からデータを収集しHadoopクラスタのHDFSへインポートするETLツールとしてAirflowを選択した。今回はAirflowの最小構成であるスタンドアロンでのセットアップとKerberos認証のかかったHDFSへの接続のための認証設定を行った。(認証自体の動作確認はまだして ...
DX(デジタルトランスフォーメーション)を推進するうえで、データを効率よく扱うためのデータ統合は欠かせません ...
[Snowflake合同会社]Cortex Code CLIの最新アップデートにより、主要データシステムのdbtおよびApache Airflow(R)に対応※本報道資料は米国スノーフレイク社が2月23日に発表した内容の抄訳です。- Cortex Code CLIは、Snowflake内でのワークフローに留まらず、dbtやApache Airflow(R)をはじめとする、主要データシステムをサポー ...
ワークフロー管理ツール「Apache Airflow」の拡張コンポーネント「Providers Edge3」に脆弱性が明らかとなった。 開発用に提供されている同コンポーネントを特定環境下で利用した際に、ウェブサーバのコンテキストで任意のコードを実行されるおそれがある脆弱 ...
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する