-
ETLでのデータプレビュー時に ソート・フィルタができるようにして欲しい
ETL構築後にJoinのキーカラムにnullや意図と異なるレコードを発見して、ETLに戻って修正……というケースがよくあります。スクリプトで加工したデータについても意図と異なる出力にしてしまっている、などの人為エラーに気づきにくく、結局データセットに出力しないと問題に気づけないですし、データフローのどの段階で間違っているのかが把握しづらいです。 現状では、フローの各段階でデータセット出力してチェックする…という操作で対応してますが、煩雑です。 ETL内のデータプレビューでこういったレコードが存在しているか、を確認・探索する手段がほしいので、データプレビューでソート・フィルタ などができるようになって欲しいです。
-
再帰的ETLの更新について
日毎に当日より先のスケジュールを更新するフローを考えています。(下記Excelのようなイメージ。前日までの数値を蓄積しつつ重なっている日付の数値を更新する。) その際に以下のような再帰的なETLを作成したのですが、更新方法を「データセットが更新された時」にしておくと「不完全なデータ..」というエラーを吐き、実行できなくなってしまいます。( 手動では更新できます。) ETLの内訳としてはフィルターで過去と現在から未来の2つに分けて最後に結合しています。 このエラーを回避する方法は各データセットを少しずつずらしてスケジューリングして更新する以外にございますでしょうか? ご教示いただけると幸いです。
-
累積データを連続性のあるグラフにしたい
現在上の図のように12/19に215、12/29に216とデータが入力されている状況です。 12/20~28にも215と数値を入れ、12/29以降には216と入れたいのですがどうすればよいでしょうか? Datasetの日付列には12/19、12/29しかない状態ですので間の日付を入れる必要があればそれもご教示いただきたいです。