無料更新サービス
我々社のDatabricks-Certified-Data-Engineer-Professional日本語試験勉強資料は認定試験の情報によって更新されています。購入の日から一年以内に更新サービスを無料で提供して、我々社のシステムはメールで更新しているDatabricks-Certified-Data-Engineer-Professional日本語試験勉強資料をタイムリーに送信します。お客様は最新のDatabricks-Certified-Data-Engineer-Professional日本語試験勉強資料を得られるために、弊社は日々努力しています。
正確の問題と解答
すべてのDatabricks-Certified-Data-Engineer-Professional日本語試験問題は、Databricks-Certified-Data-Engineer-Professional日本語豊かな認定知識を所有する専門家は過去の試験データと最新の試験情報をまとめて作られるテストエンジンです。我々社の学習教材は実際試験内容を約98%にカバーし、あなたはDatabricks-Certified-Data-Engineer-Professional日本語模擬試験で高いポイントを保証します。支払い前に、試験問題集の無料デモをダウンロードして、質問と回答の正確性をチェックしてください。
もしお客様は初心者であるなら、我が社のDatabricks Certified Data Engineer Professional Exam (Databricks-Certified-Data-Engineer-Professional日本語版)学習資料はより良い勉強方法とトレーニングガイドを提供して、お客様の学習の効率を向上させることができます。お客様はただ20~30時間ぐらいがかかって、我々のDatabricks-Certified-Data-Engineer-Professional日本語試験学習資料を練習すれば、試験に参加することができて、高いポイントを得られます。
我が社のDatabricks-Certified-Data-Engineer-Professional日本語試験勉強資料をオンランでダウンロードできます。Databricks-Certified-Data-Engineer-Professional日本語試験問題教材のデモを無料に提供して、お客様が購入前に試験学習資料の正確性を良く了解することができます。お客様の支払い終了に、10分以内にDatabricks-Certified-Data-Engineer-Professional日本語試験勉強資料をメールボックスに受け入れます。
Databricks Certified Data Engineer Professional Exam (Databricks-Certified-Data-Engineer-Professional日本語版) 認定 Databricks-Certified-Data-Engineer-Professional日本語 試験問題:
1. データ エンジニアは、ストリーミング注文データを処理するための Lakeflow 宣言型パイプラインを設計しています。
パイプラインはオートローダーを使用してデータを取り込み、customer_idとamountが0より大きいことを確認することでデータ品質を強化する必要があります。無効なレコードは削除する必要があります。Lakeflowの宣言型パイプライン構成のうち、Pythonを使用してこの要件を実装できるものはどれですか?
A) @dlt.table
@dlt.expect("valid_customer", "customer_id IS NOT NULL")
@dlt.expect("valid_amount", "amount > 0")
def silver_orders():
return dlt.read_stream("bronze_orders")
B) @dlt.table
def silver_orders():
return (
dlt.read_stream("bronze_orders")
.expect("valid_customer", "customer_id IS NOT NULL")
.expect("valid_amount", "amount > 0")
)
C) @dlt.table
def silver_orders():
return (
dlt.read_stream("bronze_orders")
.expect_or_drop("valid_customer", "customer_id IS NOT NULL")
.expect_or_drop("valid_amount", "amount > 0")
)
D) @dlt.table
@dlt.expect_or_drop("valid_customer", "customer_id IS NOT NULL")
@dlt.expect_or_drop("valid_amount", "amount > 0")
def silver_orders():
return dlt.read_stream("bronze_orders")
2. 次のロジックを使用して、activity_details という名前の Delta テーブルに CHECK 制約が正常に追加されました。
バッチジョブは、緯度 = のレコードを含む新しいレコードをテーブルに挿入しようとしています。
45.50、経度 = 212.67。
このバッチ挿入の結果を説明するステートメントはどれですか?
A) 書き込みにはターゲット テーブル内のすべてのレコードが含まれます。違反は valid_coordinates というブール列に示されます。
B) 書き込みでは、テーブル制約に違反するレコードを除くすべてのレコードが挿入されます。違反するレコードは警告ログに報告されます。
C) 書き込みでは、テーブル制約に違反するレコードを除くすべてのレコードが挿入されます。違反するレコードは隔離テーブルに記録されます。
D) 制約違反のため書き込みは完全に失敗し、ターゲット テーブルにレコードは挿入されません。
E) 違反レコードに達すると書き込みは失敗します。以前に処理されたレコードはターゲット テーブルに記録されます。
3. ストレージとコンピューティングのコストを削減するために、データ エンジニアリング チームには、ビジネス インテリジェンス ダッシュボード、顧客向けアプリケーション、本番環境の機械学習モデル、アドホック分析クエリによって活用される一連の集計テーブルをキュレートする任務が与えられています。
データエンジニアリングチームは、顧客向けアプリケーションからの新たな要件を認識しました。これは、彼らが完全に管理する唯一のダウンストリームワークロードです。その結果、組織全体の多数のチームが使用する集計テーブルで、いくつかのフィールドの名前を変更する必要があり、さらにフィールドも追加する必要があります。
管理する必要があるテーブルの数を増やすことなく、組織内の他のチームへの影響を最小限に抑えながら状況に対処できるソリューションはどれですか?
A) 必要なすべてのフィールドと新しい名前を持つ新しいテーブルを構成し、これを顧客向けアプリケーションのソースとして使用します。新しいテーブルから選択したフィールドにエイリアスを設定することで、元のデータ スキーマとテーブル名を維持するビューを作成します。
B) 現在のテーブル定義を、現在集計テーブルを書き込んでいるクエリ ロジックで定義された論理ビューに置き換え、顧客向けアプリケーションを強化するための新しいテーブルを作成します。
C) 必要なスキーマと新しいフィールドを持つ新しいテーブルを作成し、Delta Lake のディープ クローン機能を使用して、1 つのテーブルにコミットされた変更を対応するテーブルに同期します。
D) テーブルのスキーマが変更されることをすべてのユーザーに通知します。通知には、履歴クエリと一致するように新しいテーブル スキーマを元に戻すために必要なロジックを含めます。
E) 特定の日付にテーブル スキーマとフィールド名が変更されることをすべてのユーザーに警告するテーブル コメントを追加します。顧客向けアプリケーションの仕様に合わせて、既存のテーブルを上書きします。
4. データパイプラインは、構造化ストリーミングを使用してKafkaからDelta Lakeにデータを取り込みます。データはBronzeテーブルに保存され、Kafka_generatedのタイムスタンプ、キー、値が含まれます。パイプラインの導入から3か月後、データエンジニアリングチームは、特定の時間帯にレイテンシが発生していることに気付きました。
シニアデータエンジニアがDelta Tableのスキーマと取り込みロジックを更新し、Apache Sparkによって記録された現在のタイムスタンプとKafkaのトピックおよびパーティションを追加します。チームは、追加されたメタデータフィールドを使用して、一時的な処理遅延を診断する予定です。
この問題を診断する際に、チームはどのような制限に直面するでしょうか?
A) テーブル スキーマを更新するには、追加されるファイルごとにデフォルト値を指定する必要があります。
B) テーブル スキーマを更新すると、Delta トランザクション ログ メタデータが無効になります。
C) 運用 Delta テーブルに新しいフィールドを追加することはできません。
D) 履歴レコードに対して新しいフィールドは計算されません。
E) Spark は、kafka ソースからトピック パーティション フィールドをキャプチャできません。
5. データエンジニアは、修復履歴を含む最新のジョブ実行に関する情報を収集するアプリケーションを作成する必要があります。データエンジニアはリクエストをどのようにフォーマットすればよいでしょうか?
A) run_id と include_history パラメータを指定して /api/2.1/jobs/runs/get を呼び出します。
B) run_id と include_history パラメータを指定して /api/2.1/jobs/runs/list を呼び出します。
C) job_idとinclude_historyパラメータを指定して/api/2.1/jobs/runs/getを呼び出します。
D) job_idとinclude_historyパラメータを指定して/api/2.1/jobs/runs/listを呼び出します。
質問と回答:
| 質問 # 1 正解: C | 質問 # 2 正解: D | 質問 # 3 正解: A | 質問 # 4 正解: D | 質問 # 5 正解: D |

弊社は製品に自信を持っており、面倒な製品を提供していません。


Tazawa


